Аналіз выкарыстання камп'ютэрў у біяінфарматыцы

ЗМЕСТ

ЗМЕСТ

УВОДЗІНЫ

ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

§1. Асноўныя прымяненні інфармацыйных тэхналогій

§2 Банкі даных біялагічнай інфармацыі

§3 Візуалізацыя біялагічнай інфармацыі

§4 Пашуковыя сістэмы

ГЛАВА 2 ВЫКАРЫСТАННЕ ІНФАРМАЦЫЙНЫХ ТЭХНАЛОГІЙ ДЛЯ ЗАДАЧ ПАРАЎНАННЯ Ў БІЯІНФАРМАТЫЦЫ

§1 Супастаўленне з узорам

§2 Параўнанне структур бялкоў

ГЛАВА 3

ВЫКАРЫСТАННЕ ПРАГРАМНЫХ БІБЛІЯТЭК

§1 Бібліятэка BioJava

Глава 4 ПРАКТЫЧНАЕ ВЫКАРЫСТАННЕ БІБЛІЯТЭКІ BIOJAVA

§1 Пастаноўка задачы

§2 Усталёўка бібліятэкі

§3 Выбар алгарытмаў

§4 Напісанне праграмы пошуку найбліжэйшых паслядоўнасцяў

§5 Тэсціраванне праграмы пошуку найбліжэйшых паслядоўнасцяў

ЗАКЛЮЧЭННЕ

СПІС ВЫКАРЫСТАНАЙ ЛІТАРАТУРЫ

ДАДАТАК 1


УВОДЗІНЫ

Сёння ўсё хутчэй нарастае аб'ём малекулярна-біялагічных і малекулярна-генетычных даных. Асэнсаванне гэтых каласальных па аб'ёмах даных ужо немагчыма без прыцягнення інфармацыйных тэхналогій і матэматыкі. Менавіта таму на стыку інфарматыкі, біялогіі і матэматыкі ўзнікла біяінфарматыка. Пад біяінфарматыкай зараз разумеюць прымяненне камп'ютэраў для вывучэння біялагічных аб'ектаў. У больш вузкім сэнсе яе можна разумець як прымяненне камп'ютэрных метадаў для вырашэння задач малекулярнай біялогіі. Сярод асноўных задач біяінфарматыкі вылучаюць:

l вывучэнне геномаў

l аналіз і прадказанне структуры бялкоў

l аналіз і прадказанне ўзаемадзеяння бялкоў

Біяінфарматыка ўключае ў сябе наступныя элементы:

l базы даных, у якіх захоўваецца інфармацыя пра біялагічныя аб'екты

l набор інструментаў для аналізу і апрацоўкі гэтай інфармацыі

l распрацоўку матэматычных мадэляў біялагічных аб'ектаў і алгарытмаў рашэння разнастайных біялагічных задач

Сярод банкаў даных найбольш вядомым прадстаўніком з'яўляецца Protein Data Bank (PDB) (1). Гэта сховішча трохмернай структурнай інфармацыі аб бялках і нуклеінавых кіслотах. Гэтыя даныя звычайна атрымоўваюцца з дапамогай рэнтгенавай крысталаграфіі ці спектраскапіі на аснове ядзерна-магнітнага рэзанансу. Напаўняюць банк біёлагі і біяхімікі эксперыментальнымі данымі.

На бягучы час існуе шмат пакетаў праграм, якія прыназначаны для работы з біяфізічнай і біяхімічнай інфармацыяй. Вылучаюць наступныя накірункі:

l візуалізатары інфармацыі з банкаў даных біялагічнай інфармацыі

l прадказанне другаснай ці трэцічнай структуры бялку па вядомай першаснай структуры

l прадказанне ўзаемадзеяння бялок-бялок і бялок-рэчыва

l параўнанне бялкоў з банкаў даных і ацэнка іх падабенства

l пабудова іерархічных дрэваў эвалюцыі біялагічных аб'ектаў

Варта заўважыць, што ўсе гэтыя банкі і праграмы пабудаваны з улікам існуючых алгарытмаў збору, захавання і апрацоўкі біялагічнай інфармацыі. З-за таго, што амаль усе задачы адносяцца да класу NP-поўных, то атрыманне рашэння ператвараецца ў складаную задачу. З-за медыцынскай важнасці гэтым праблемам прысвечана шмат увагі, што выклікае цеснае ўзаемадзеянне інфарматыкаў, біяхімікаў і біяфізікаў. Гэтыя праблемы і будуць асвечаны ў дадзенай працы.


ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

§1. Асноўныя прымяненні інфармацыйных тэхналогій

Як ужо было сказана, выкарыстанне камп'ютэраў для вырашэння біялагічных задач стала неабходным. Асноўныя сферы іх прымянення наступныя:

l камунікацыя

l кіраванне прыстасаваннямі

l вылічэнні

l захаванне

Камп'ютэры шырока выкарыстоўваюцца для кіравання разнастайнымі прыстасаваннямі для працы з біялагічнымі аб'ектамі: машынамі для секвенціравання ДНК, брадзільнымі чанамі, біярэактарамі і гэтак далей. Гэтыя устаноўкі кіруюцца праграмуемымі рукамі-робатамі і змяншаюць патрэбу ў людзях-аператарах. Там, дзе вельмі важны час выканання, камп'ютэры выйграюць у людзей, бо могуць працаваць без перапынкаў і з вялікай дакладнасцю.

З развіццём сеткавых тэхналогій і персанальных камп'ютэраў падрыхтоўка вучоным артыкула стала не толькі ў разы хутчэйшым, але і яго распаўсюджванне таксама паскорылася. Зараз мала хто з вучоных будзе адразу звяртацца да папяровага выдання, а хутчэй за ўсё звернецца да адной са шматлікіх баз даных біялагічных структур. Стала магчымай сумесная праца вучоных у геаграфічна аддаленых рэгіёнах.

Вылічальныя задачы ў біяінфарматыцы прадстаўлены вельмі шырока: ад візуалізацыі і пошуку падобных амінакіслотных ланцужкоў да мадэліравання ўзаемадзеяння складаных бялкоў па трохмерных іх структурах. Рашэнню такіх задач дапамагае вялікая колькасць гатовых праграмных сродкаў, а таксама наяўасць гатовых праграмных бібліятэк, якія спрашчаюць напісанне новых праграм і падтрымку старых.

Функцыі захавання шырока прадстаўлены ў выглядзе разнастайных сховішчаў інфармацыі, адрозных па сваёй эфектыўнасці, даступнасці і характары інфармацыі, для працы з якой яны прыназначаны.

§2 Банкі даных біялагічнай інфармацыі

Адной з найважнейшых частак прымянення камп’ютэраў у малекулярнай біялогіі з’яўляецца захаванне біялагічнай інфармацыі. Для гэтай мэты існуе шэраг спецыяльных сховішчаў, гэтак званых банкаў даных ці баз даных. Яны знаходзяцца ў цэнтры выкарыстання інфармацыйных тэхналогій у біяінфарматыцы. Насамрэч, большасць аперацый па вылічэннях і камунікацыі заснавана на даных, што знаходзяцца ў банках даных. Інфармацыя ў іх захоўваецца на трывалай і доўгачасовай аснове, амаль не падвяргаецца зменам, і яе форма прыстасаваная для хуткага выканання аперацый пошуку, сартыроўкі і іншых.

Існуе шэраг розных тыпаў такіх сховішчаў: банкі нуклеатыдных паслядоўнасцяў, бялковых паслядоўнасцяў, трохмерных структур, паслядоўнасных матываў (матыў – невялікі структурны элементы, які сустракаецца ў многіх пратэінах, напрыклад, α-спіраль). У табліцы 1.1 прыведзены некаторыя прадстаўнікі кожнага тыпу баз даных (2).

Табліца 1.1. Тыпы баз біялагічных даных

Тып базы даныхПрыкладыЗаўвага
Нуклеатыдныя паслядоўнасціGenBankАдна з найвялікшых баз даных паслядоўнасцяў
EMBLЕўрапейская лабараторыя малекулярнай біялогіі
NDBБаза даных нуклеінавых кіслотаў
Бялковыя паслядоўнасціSWISS-PROTШвейцарскі і Еўрапейскі інстытуты біяінфарматыкі
PIRРэсурс інфармацыі пра бялкі
Трохмерныя структурыPDBБанк пратэінавых даных
MMDBБаза даных малекулярнага мадэліравання
Паслядоўнасныя матывыLIGANDХімічныя структуры і рэакцыі
PROSITEПаслядоўнасныя матывы
ProDOMБялковыя дамены
Актуально: