Главная страница
Навигация по странице:

  • Биоинформа́тика

  • Геномика и биоинформатика


    Скачать 43.62 Kb.
    НазваниеГеномика и биоинформатика
    Анкор№ 1. genomika i bioinformatika.docx
    Дата16.05.2021
    Размер43.62 Kb.
    Формат файлаdocx
    Имя файлаgenomika i bioinformatika.docx
    ТипДокументы
    #205573

    ГЕНОМИКА И БИОИНФОРМАТИКА

    Со времени своего появления, во второй половине 20-го века, наука информатика начала широко внедряться и сотрудничать (и продолжает это и в наши дни) с другими науками: физико-математическими, техническими, гуманитарными и пр. Перефразируя всем известные слова М.В. Ломоносова, можно сказать, что «широко простирает информатика руки свои в дела человеческие». Сейчас трудно найти такую область науки, которая бы обходилась без методов информатики. Не избежали этого и естественные науки. В конце 60-х – начале 70-х годов прошлого века ЭВМ стали активно применяться в биологии: к этому времени возросла их память, увеличилась скорость операций, уменьшились размеры. И к тому же накопилось большое количество экспериментальных данных по биологии, требующих осмысления и обработки. Например, уже к 2003 г. объединенными усилиями ученых многих стран был в общих чертах прочитан геном человека. Таким образом, на стыке XX-го и XXI-го веков появилась бурно развивающаяся область биомедицинской науки биоинформатика, которой к настоящему времени насчитывается уже около 30 лет. Биоинформатика обязана своим появлением накоплению обширных экспериментальных данных. Особенно заметно это накопление стало проходить в 70-х гг. XX-го века. Информации, получаемой в биологических экспериментах, было значительно больше, чем возможности человека к запоминанию фак- тов и их анализу. Возникла необходимость хранения все быстрее увеличи- вающегося объема информации. Первые несколько сотен расшифрованных последовательностей белков были опубликованы в виде книги-атласа. Од- нако уже в начале 70-х г. число расшифрованных последовательностей возросло настолько, что из-за их объема оказались невозможными публи- кации в виде книг. Стало понятно, что нужны специальные программы для сравнения последовательностей, поскольку мозг человека не справляется с анализом такой информации. В 90-е годы происходит расцвет геномики. К настоящему времени рас- шифрованы полные геномные последовательности человека, мыши, цып- 72 Информатика в науке и образовании ленка, лягушки, отдельных видов рыб, круглых червей, нескольких сотен вирусов и бактерий и т.д. Прочтение генома бактерии – это теперь задача, посильная для группы из 2–3 исследователей за время, меньшее, чем один год. Геном человека составляет около 3-х миллиардов букв, что эквива- лентно 15000 книжных томов. А значение факта его «прочтения» для био- логов сравнимо с открытием Д.И. Менделеевым периодического закона для химиков. Поэтому для обработки такой обширной биологической информации на помощь пришли компьютерные технологии. Первый алгоритм выравнива- ния генных последовательностей был предложен еще в 1970 г. Компьюте- ры позволили хранить информацию в виртуальных банках данных и опе- рировать ею с большой скоростью. Биоинформатика, как и многие другие современные науки, развивается на стыке разных наук: молекулярной био- логии, генетики, математики и компьютерных технологий. Основная ее задача – разработка вычислительных алгоритмов для анализа и системати- зации данных о структуре и функциях биологических молекул, прежде всего нуклеиновых кислот и белков. Объем генетической информации, накапливаемый в банках данных, на- чал увеличиваться с возрастающей скоростью после того, как были разра- ботаны быстрые методы секвенирования (расшифровки) нуклеотидных последовательностей ДНК. Достижения информатики, лингвистики и тео- рии информации сделали возможным анализ генетических текстов. Взаи- мосвязанное развитие биоинформатики с другими областями науки позво- ляет рассчитывать на формирование нового уровня понимания биологиче- ских процессов, происходящих в клетках и организмах. Если учесть, что первый персональный компьютер появился в 1981 г., а Интернет (World Wide Web) – в 1991 г., т.е. совсем недавно, то это имело колоссальное значение для развития не только предмета науки, но и ее ор- ганизации. Один из главных принципов биоинформатики (как, впрочем, и других наук) – принцип единого мирового информационного пространст- ва, объединяющего усилия ученых, работающих по всему миру. Цель данной статьи – дать определение и понятия для широкого круга лиц, что такое биоинформатика, не вдаваясь в глубинные процессы, дос- тупные для понимания лишь узким специалистам-биоинформатикам. В конце статьи в качестве приложения приводится словарь специфических биологических терминов, не всегда известных читателям других специаль- ностей.

    Несговорова Г.П.
    Биоинформатика: пути развития и перспективы
    1. ЧТО ТАКОЕ БИОИНФОРМАТИКА

    Истоки зарождения биоинформатики восходят к давним временам, к 13 веку. Молодой итальянец Леонардо из Пизы, вошедший в историю матема- тики под именем Фибоначчи и знаменитый одноименными числами, опи- сал решение задачи о размножении кроликов, построив тем самым первую математическую модель биологического процесса. А в 20-е годы XX века другой итальянский математик, Вито Вольтерра, создал модель совместно- го существования двух биологических популяций типа «хищник–жертва». После Второй мировой войны, в конце 40-х годов прошлого столетия, в биологию пришли математики и физики. Современная история биологии начинается в 1953 году, когда американскими учеными Уотсоном и Кри- ком была открыта двойная спираль ДНК. К настоящему времени существуют разные определения биоинформа- тики, но в основном под биоинформатикой понимают любое использова- ние компьютеров для обработки разного рода биологической информации. Сегодня поле термина «биоинформатика» значительно расширилось и включает все реализации математических алгоритмов, связанных с биоло- гическими объектами, и информационно-коммуникационных дисциплин, применяемых в биологических исследованиях. В биоинформатике, помимо самой информатики, используются методы прикладной математики, стати- стики и других точных наук. Биоинформатика используется также в био- химии, биофизике, экологии, генетике и в ряде других областей естествен- ных наук. Биоинформатика включает в себя: 1) математические методы компьютерного анализа в сравнительной геномике (геномная биоинформатика); 2) разработку алгоритмов и программ для предсказания пространствен- ной структуры белков (структурная биоинформатика); 3) исследование стратегий соответствующих вычислительных методо- логий, а также общее управление биологическими системами информаци- онной сложности. Модное среди современных ученых слово «биоинформатика» – это уже почти отделившаяся ветвь молекулярной биологии. На сегодняшний день существует множество его определений и интерпретаций. Пока это еще не совсем устоявшийся термин. Рассмотрим это подробней. Одни говорят, что биоинформатика –это раздел современной науки, за- нимающейся раскодированием человеческого генома. 74 Информатика в науке и образовании Другие утверждают, что биоинформатика – это системная биология, по- зволяющая рассмотреть, изучить и систематизировать глобальную картину биологии. Третьи считают, что биоинформатика – это аналог молекулярной био- логии с той лишь разницей, что молекулярная биология занимается науч- ными исследованиями в пробирке, а биоинформатика – при помощи мощ- ных компьютерных систем. Четвертые верят, что биоинфоматика – это возможность по структуре макромолекулы очень быстро найти гены-мишени и создать новые лекар- ственные препараты. И каждый из них по-своему прав. Существуют такие биологические утверждения, которые сначала были предсказаны, а потом проверены, и оказалось, что так и есть. Отсюда появ- ляются такие ветви биоинформатики, как предсказательная, аналитическая, эволюционная. В практическом смысле биоинформатика – это прикладная наука, об- служивающая интересы биологов. К области технической биоинформатики относится первичная обработка данных. Полученные данные надо где-то хранить, обеспечивать к ним удобный доступ и т.д. Более сложное и инте- ресное занятие биоинформатиков – получать на основе данных о геноме конкретные утверждения: белок А обладает такой-то функцией, ген В включается в таких-то условиях и т.п. В этом и состоит практическое при- менение науки биоинформатики. Биоинформатика находит свое применение в следующих направлениях биологической науки: – геномика, транскриптомика и протеомика; – компьютерное моделирование в биологии развития; – компьютерный анализ генных сетей; – моделирование в популяционой генетики. Биоинформатика легко вписалась также в фармакологию, позволяя сни- зить срок проектирования препарата с 5-6 лет до нескольких месяцев, а также интегрировалась во многие другие медицинские и биологические науки. На сегодняшний день существуют следующие разделы биоинформати- ки: – биоинформатика в целом; – клиническая биоинформатика; – структурная геномика; – функциональная геномика; Несговорова Г.П. Биоинформатика: пути развития и перспективы 75 – фармакогеномика; – клиническая протеомика; – функциональная протеомика; – структурная протеомика. С помощью методов биоинформатики возможно не просто обрабаты- вать огромный массив различных биологических данных, но и выявлять закономерности, которые не всегда можно заметить при обычном экспе- рименте, предсказываать функции генов и зашифрованных в них белков, строить модели взаимодействия генов в клетке, конструировать лекарст- венные препараты.
    2. ОСНОВНЫЕ ОБЛАСТИ ИССЛЕДОВАНИЙ В БИОИНФОРМАТИКЕ

    Рассмотрим подробнее основные области исследований в биоинформатике.
    2.1. Анализ генетических последовательностей С тех пор как в 1977 г. был секвенирован фаг Phi-X 174, последователь- ности ДНК всё большего числа организмов были дешифрованы и сохране- ны в базах данных. Эти данные используются для определения последова- тельностей белков и регуляторных участков. С ростом количества данных уже давно стало невозможным анализировать последовательности вруч- ную. В наши дни для поиска по геномам тысяч организмов, состоящих из миллиардов пар нуклеотидов, используются компьютерные программы. Сборка фрагментов ДНК может быть довольно сложной задачей для больших геномов. Сейчас этот метод применяется практически для всех геномов, и алгоритмы сборки геномов являются одной из острейших про- блем биоинформатики на сегодняшний день. Обработка гигантского коли- чества данных, получаемых при секвенировании, является одной из важ- нейших задач биоинформатики. Другим примером применения компьютер-

    2.1. АНАЛИЗ ГЕНЕТИЧЕСКИХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

    С тех пор как в 1977 г. был секвенирован фаг Phi-X 174, последователь- ности ДНК всё большего числа организмов были дешифрованы и сохране- ны в базах данных. Эти данные используются для определения последова- тельностей белков и регуляторных участков. С ростом количества данных уже давно стало невозможным анализировать последовательности вруч- ную. В наши дни для поиска по геномам тысяч организмов, состоящих из миллиардов пар нуклеотидов, используются компьютерные программы. Сборка фрагментов ДНК может быть довольно сложной задачей для больших геномов. Сейчас этот метод применяется практически для всех геномов, и алгоритмы сборки геномов являются одной из острейших про- блем биоинформатики на сегодняшний день. Обработка гигантского коли- чества данных, получаемых при секвенировании, является одной из важ- нейших задач биоинформатики. Другим примером применения компьютер- ного анализа генетических последовательностей является автоматический поиск генов и регуляторных последовательностей в геноме. 2.2. Аннотация геномов В контексте геномики аннотация – это процесс маркировки генов и дру- гих объектов в последовательности ДНК. Первая программная система ан- нотации геномов была создана еще в 1955 году Оуэном Уайтом. 76 Информатика в науке и образовании 2.3. Вычислительная эволюционная биология Эволюционная биология исследует происхождение и появление видов, их развитие с течением времени. Информатика помогает эволюционным биологам в нескольких аспектах: 1) изучать эволюцию большого числа организмов, измеряя изменения всех ДНК; 2) сравнивать целые геномы, что позволяет изучать более комплексные эволюционные события; 3) строить компьютерные модели популяций, чтобы предсказывать по- ведение системы во времени; 4) отслеживать появление публикаций, содержащих информацию о большом количестве видов. 2.4. Оценка биологического разнообразия Биологическое разнообразие экосистемы может быть определено как полная генетическая совокупность определенной среды, состоящая из всех обитающих видов, будь это капля воды или горсть земли или вся биосфера планеты Земля. Специализированное программное обеспечение применяется для поиска, визуализации и анализа информации и, что особенно важ- но, для предоставления ее другим людям. Помимо биоинформатики в современной научной биологической литературе встречается также термин «вычислительная биология». Считается, что вычислительная биология – это не область науки, а подход к использованию компьютеров для изучения биологических процессов. Термины «биоинформатика» и «вычислительная биология» пока еще часто употребляют как синонимы, хотя «вычислительная биология» чаще указывает на разработку алгоритмов и конкретные вычислительные методы. Считается, что не всё использование вычислительной биологии является биоинформатикой, например, математическое моделирование – это не биоинформатика, хотя и связано с биологическими задачами. Существует еще и математическая биология, которая, как и биоинфор- матика, также решает биологические задачи, но используемые при этом методы не являются численными, и им не требуется реализация в про- граммном или аппаратном обеспечении. Отдельно выделяется структурная биоинформатика, к которой относит- ся разработка алгоритмов и программ для предсказания пространственной структуры белков. Биоинформатика, таким образом, входит в разделы био- Несговорова Г.П. Биоинформатика: пути развития и перспективы 77 логии наряду с анатомией, ботаникой, вирусологией, микробиологией, ци- тологией, палеонтологией, физиологией и т.д.
    3. МЕСТО БИОИНФОРМАТИКИ В ЦЕПИ БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

    Биоинформатика анализирует факты, которые получены в эксперимен- тальной биологии. Полученные данные экспериментатор сравнивает со всем набором, уже имеющимся в банке данных. Если он не нашел в этом банке открытой им последовательности, он заносит ее туда, пополняя тем самым банк. В функции банков включается хранение, систематизация, об- новление информации и обеспечение доступа к ней. Эти операции требуют огромных компьютерных мощностей. Существуют также банки научных публикаций по биологической тема- тике. Каждая статья, выходящая в номере любого научного журнала по биологии, помещается в банк и аннотируется так, чтобы любой другой уче- ный мог легко найти ее через Интернет. Крупнейшая on-line библиотека медико-биологических публикаций PubMed содержит более 16 млн. статей, вышедших в течение последних 50 лет. Интегральные банки данных и энциклопедии выполняют важную функ- цию, объединяя в себе всю известную информацию о конкретном гене, белке, организме и т.д. Они обобщают информацию из большого числа других банков данных и постоянно обновляют ее. Рассмотрим, какие исследовательские цели ставит перед собой биоин- форматика. 3.1. Анализ геномов, поиск в них генов Любой вновь прочитанный геном представляет собой огромную после- довательность повторяющихся в разных комбинациях букв. Биоинформа- тика позволяет выделить гены в этом текстовом многообразии. Такая опе- рация выделения гена из генома называется разметкой генома. 3.2. Предсказание функции генов Выяснить функции всех генов опытным путем достаточно трудоемко. В этом случае биоинформатика помогает предсказывать их, опираясь на сравнение с теми генами, функции которых уже определены. 78 Информатика в науке и образовании 3.3. Оценка роли отдельных участков последовательности в функционировании белка В молекуле белка есть участки, отвечающие за решение разного рода биологических задач. Распознавание этих участков с помощью методов биоинформатики расшифровывает весь спектр функций конкретного белка. 3.4. Построение молекулярных моделей белков на основе их последовательностей Структуры белков определяют опытным путем, например, облучая мик- роскопический кристалл, состоящий из молекул белка, рентгеновскими лучами. Это достаточно долгий и дорогой процесс. Некоторые белки вооб- ще невозможно анализировать так, поскольку они не имеют кристалличе- ской структуры. Биоинформатика с помощью компьютерного моделирова- ния помогает воссоздать пространственную модель белка, если известна структура белка с хотя бы отдаленно похожей последовательностью. 3.5. Исследование механизма функционирования макромоделей, исходя из их моделей Зная пространственную структуру молекулы, полученную благодаря методам биоинформатики, можно предсказать, как она работает, и как на ее работу можно повлиять. 3.6. Компьютерное конструирование лекарств Лекарства можно конструировать, моделируя в пространстве взаимо- действие различных химических соединений с белком-мишенью. При этом надо перебрать огромное количество соединений и выбрать оптимальное. 3.7. Анализ информации Соединение биологии, химии, физики, математики и информатики по- зволяет разносторонне описывать биологическую систему. Использование компьютерных ресурсов помогает многократно ускорить процесс анализа и повысить точность и скорость получения результатов.

    Несговорова Г.П. Биоинформатика: пути развития и перспективы 79 3.8.

    Использование достижений информатики Новые открытия в биологии с использованием технологий биоинформа- тики быстро находят свое применение в медицине, фармакологии, космето- логии, биотехнологии, сельском хозяйстве, экологии и других областях. Биоинформатика самостоятельно дает результаты, имеющие практическую значимость, а также обеспечивает условия для работы разных областей биологии. 3.9. Основные технологии биоинформатики Большая часть работ по биоинформатике сконцентрирована вокруг тех- нологии использования баз данных для хранения биологической информа- ции с последующей ее обработкой. Такие базы данных могут быть публич- ными или приватными. Очень важным является предоставление публично- го доступа к таким базам данных через открытые стандарты. Получает раз- витие использование онтологий и логических методов для обработки био- логической информации, хотя этот подход менее распространен, чем ис- пользование баз данных.
    4. БИОИНФОРМАТИКА НА СОВРЕМЕННОМ ЭТАПЕ РАЗВИТИЯ

    4.1. Развитие биоинформатики в мире

    На рубеже 20-21 веков биоинформатика превратилась в бурно развивающуюся область мировой биомедицинской науки. Наряду с исследователями, ведущими фундаментальные разработки, потребителями биоинформационных технологий являются медицинские, фармакологические, биотехнологичные и учебные учреждения. Эта область науки определена в качестве приоритетной как в США, так и во всех других развитых странах. Количество центров биоинформатики постоянно растет во всех странах Европы, Азии, США и Австралии. Наряду с государственными, академическими и образовательными центрами биоинформатики, в последние годы возникло значительное число организаций и проектов, ориентированных на коммерческое использование результатов исследований в области био- информатики. Это прежде всего организации, деятельность которых ори- ентирована на структурный, функциональный и сравнительный анализ ге- номов, включая геном человека. Наряду с применением уже созданных ме- 80 Информатика в науке и образовании тодов биоинформатики интенсивно развивается техническая и программная база для решения прикладных задач, особенно в фармакологии. Быстрыми темпами совершенствуется также и индустрия программного обеспечения для решения таких задач. 4.2. Состояние биоинформатики в России Биоинформатика относится к интеллектуальным, высокотехнологичным разделам науки, где получаемые результаты в значительной степени зави- сят от развитого творческого мышления ученых, а не определяются в ос- новном затратами на их техническую вооруженность. Таким образом, учи- тывая достаточно высокий интеллектуальный и образовательный уровень российских ученых и практическую невозможность больших финансовых затрат в современной экономической ситуации, биоинформатика имеет все основания стать одним из приоритетных направлений науки в Российской федерации. Уже к 1984 г. стало ясно, что в России (тогда бывшем СССР) образовалась достаточная «критическая масса» специалистов в области применения математических методов в биологии. К этому же времени скопилось достаточно большое количество биологической информации, обработка, ос- мысление и анализ которой стало невозможно проводить без компьютер- ной поддержки. Все это и явилось предпосылкой для возникновения новой отрасли биологической науки – биоинформатики. Количество публикаций по биоинформатике в последние годы стреми- тельно нарастает. Работы в области биоинформатики активно печатались в 90-е годы, но сами эксперименты, описываемые в статьях, были проведены ранее. База для реализации комплексного подхода к проблеме и написания статей создавалась в течение многих лет усилиями многочисленных иссле- дователей. Первые работы по теоретическому анализу аминокислотных последовательностей белков были опубликованы в 50-х годах прошлого века. В 1988 г. был начат проект по расшифровке генома человека, ставив- ший своей целью определение полной последовательности ДНК, состав- ляющей хромосомы человека. Этот проект общими усилиями ученых раз- ных стран был завершен к 2003 г. Отметим ряд институтов, где в России ведутся работы по биоинформа- тике. В Москве организован Институт математических проблем биологии РАН. Там занимаются решением разных биологических проблем при под- Несговорова Г.П. Биоинформатика: пути развития и перспективы 81 держке информационных технологий, таких как структурная и сравни- тельная геномика, основные молекулярно-биологические механизмы, мо- лекулярно-генетические системы управления, протеомика, метаболика, базы биологических данных, математическое обеспечение биологических экспериментов. При Институте проблем передачи информации РАН (ИППИ РАН) в 2003 г. основан учебно-научный центр «Биоинформатика». Также к науч- ным институтам такой тематики относятся следующие учреждения: ВНИИ «Генетика» (Москва); Институт белка РАН (Пущино); Институт биоорганической химии РАН (Москва); Институт молекулярной биологии РАН (Москва); Институт биомедицинской химии РАМН (Москва); Институт цитологии и генетики СО РАН (Новосибирск) и ряд других. Web-сайты имеются у следующих институтов: Институт биомедицинской химии РАМН (Москва) – http://www.ibmh.msk.su/bioinform Институт физико-химической биологии МГУ им. Белозерского – http://www.genebee.msu.su/ Институт цитологии и генетики СО РАН (Новосибирск) – http://www.mgs.bionet.nsc.ru/ и другие. Ряд оригинальных компьютерных программ и баз данных, созданных российскими учеными, приведен и на других сайтах. Ведется работа по подготовке отечественных специалистов в области биоинформатики. Во многих университетах и вузах биолого-медицинской тематики созданы кафедры биоинформатики и организованы учебные курсы по биоинформа- тике, такие как «Биоинформатика и компьютерное конструирование ле- карств». 4.3. Создание Центра Коллективного Пользования по биоинформатике в СО РАН В СО РАН (Новосибирский Академгородок) существует центр для раз- работки экспериментальных технологий в области биоинформатики. Для биологов НГУ и СО РАН создали единую информационную базу по био- информатике. Совместными усилиями нескольких институтов СО РАН и Новосибирского государственного университета открыт Центр Коллектив- ного Пользования (ЦКП) «БИОИНФОРМАТИКА» Суперкомпьютер центра один из самых быстрых в мире. Его производительность 16,5 терафлопс 82 Информатика в науке и образовании (16,5 триллионов операций в секунду), по мощности он не уступают анало- гичным, установленным в центре Vital-IT в Лозанне (Швейцария), система хранения данных рассчитана на 48 терабайт. Центр «Биоинформатика», по сути, – это огромная вычислительная сис- тема, суперкомпьютер, с помощью которого можно моделировать лекарст- ва от рака и СПИДа, расшифровывать геномы растений и живых организ- мов. Прочитать миллиарды и миллионы букв в геномах человека, пшеницы, вируса гепатита или энцефалита сегодня позволяет ДНК-секвенатор. В будущем ЦКП сможет помочь и специалистам смежных областей науки. Например, ученые планируют сравнить геном древнего гоминида из алтай- ской пещеры с геномом современного человека В ЦКП более 400 пользователей, это около 20 академических институ- тов СО РАН. Есть и учебные институты, и фирмы, например, «Унипро», «Шлюмберже» и др. Цель данного центра – создать сетевую инфраструктуру, которая объе- динит в технологический комплекс экспериментальные установки с вычис- лительными комплексами и хранилищами данных. Задачами самой струк- туры являются биоинформационная поддержка научно- исследовательских работ, подготовка специалистов в области компьютерной системной биоло- гии и биоинформатики, разработка новых экспериментально-теоретических технологий. Активное использование вычислительных мощностей ЦКП предполага- ется в рамках проекта СО РАН «Геномика, протеомика, биоинформатика». Организациями-учредителями проекта стали Институт цитологии и генети- ки СО РАН, Институт вычислительной математики и математической гео- физики СО РАН, Международный Томографический центр СО РАН, Ин- ститут химической биологии и фундаментальной медицины СО РАН, Ин- ститут математики СО РАН, Институт вычислительных технологий СО РАН и Новосибирский государственный университет. С 1998 г. в Институте цитологии и генетики СО РАН регулярно прово- дятся Международные конференции по биоинформатике регуляции и структуры геномов и системной биологии (Bioinformatics of Genome Regulation and Structure System Biology – BGRS/SB). На регулярно проходящем с недавних пор в Новосибирске Международном молодежном инновацион- ном форуме Интерра также уделяется внимание вопросам биоинформати- ки. Новое направление в науке требует и специалистов нового профиля. Поэтому в Академгородке осуществляется их подготовка: в школе N162 совместно с Институтом цитологии и генетики СО РАН создан профиль- Несговорова Г.П. Биоинформатика: пути развития и перспективы 83 ный 10-й класс по направлению «биоинформатика» с углубленным изуче- нием биологии, информатики, математики, физики на базе Института ци- тологии и генетики СО РАН и кафедры биоинформатики Новосибирского государственного университета. В Сибирском государственном медицинском университете (СибГМУ, Новосибирск) в учебном плане появился новый предмет – биоинформати- ка. Со второго семестра студенты 5-го курса начинают изучать эту инте- ресную и сложную науку, одно из направлений молекулярной биологии, которое исследует молекулярные процессы, но не в in vitro, а in silico, т.е. не в пробирке, а при помощи компьютера. Следует также отметить и заслуги сибирских ученых в создании новой науки. К ним относится А.А. Ляпунов, выдающийся русский ученый- математик. В 2011 г. отмечалось 100 лет со дня его рождения. Последние годы своей жизни он жил и работал в Академгородке. Надо сказать, что будучи «отцом отечественной кибернетики», он заинтересовался биологией еще в 30-е годы прошлого века. Позднее, в 50-е годы, он снова обратился к биологии. Сложность биологических систем и процессов их эволюции привлекала его как объект приложения методов исследований, характер- ных для дескрептивной теории множеств. Таким образом, он стоял у исто- ков создания новой науки на стыке математики и биологии.
    5. ПРИМЕРЫ КОНКРЕТНЫХ ПРОГРАММНЫХ КОМПЛЕКСОВ БИОИНФОРМАТИКИ

    В системной биологии важнейшую роль играют методы биоинформати- ки. Они дают возможность с помощью компьютеров – накапливать и интегрировать в банки данных экспериментальную ин- формацию; – осуществлять ее компьютерный анализ; – проводить математическое моделирование структурно-функциональ- ной организации живых систем; – предсказывать новые свойства живых систем; – на этой основе планировать новые этапы экспериментальных исследо- ваний. В этом разделе приводятся конкретные примеры баз и банков данных, базовых пакетов, программных средств для полного анализа макромоле- кул, а также других программных продуктов по биоинформатике с их ад- 84 Информатика в науке и образовании ресами в Интернете, разработанных как отечественными, так и зарубеж- ными учеными. GenBank – http://www.ncbi.nlm.nih.gov/GenBank Банк данных по нуклеотидным последовательностям (3400000000 пар оснований в 461000 последовательностей). SWISS-PROT – http://www.expasy.ch/sprot/sprot-top.html Аннотированный банк данных по аминокислотным последователь- ностям белков. PIR – http://www.nbrf.georgetown.edu/pir/searchdb.html Аннотированный банк данных по аминокислотным последователь- ностям белков, организованных в соответствии с гомологией и так- сономией. PBD – http://www.rcsb.org/pdb/ Банк данных по 3D структуре биологических макромолекул. NDB – http://ndbserver.rutgers.edu Банк данных по нуклеиновым кислотам. Включает структуры ДНК и РНК вместе с их 3-хмерными изображениями. ProDom – http://protein.toulouse.inra.fr/prodom.html Банк данных по доменам белков. Web-серверы, предоставляющие пользователю генетическую информа- цию, оснащены комплексом программных средств для поиска информации в банках данных и анализа нуклеотидных и аминокислотных последова- тельностей. В качестве запросов при поиске последовательностей в банках данных могут использоваться номенклатурные названия генов, организмов, ключевые слова и др. В качестве примера предложим программу Auto Dok, которая является программой для автоматического докинга. С ее помощью можно посмот- реть, как молекулы лекарств или кандидатов на роль лекарств взаимодейст- вуют в известной 3D-структуре. В частности, программа применяется для разработки лекарств, специфически связывающихся с тем или иным бел- ком. Здесь же приведем примеры основных программ сравнения аминокис- лотных и нуклеотидных последовательностей. ACT – (Artemis Comparison Tool) – геномный анализ; Arlequin – анализ популяционно-генетических данных; Bio Edit – редактор множественного выравнивания аминокислотных и нуклеотидных последовательностей; Несговорова Г.П. Биоинформатика: пути развития и перспективы 85 Bio Numerics – коммерческий универсальный пакет программ по био- информатике; BLAST – поиск родственных последовательностей в базе данных ами- нокислотных и нуклеотидных последовательностей; ClustaIW – множественное выравнивание аминокислотных и нуклео- тидных последовательностей; FASTA – набор алгоритмов определения схожести аминокислотных и нуклеотидных последовательностей; Mesquite – программа для сравнительной биологии на языке Java; Muscle – множественное сравнение аминокислотных и нуклеотидных последовательностей. Более быстрая и точная программа в сравне- нии ClustaIW; Pop Gene – анализ генетического разнообразия популяций; Populations – популяционно-генетический анализ. Примером интегрированного инструмента биолога является также Unipro UGENE. Это свободно распространяемое программное обеспечение для работы молекулярного биолога. Пользовательский интерфейс этого продукта обеспечивает: – простую и удобную работу с последовательностями; – визуализацию хроматограмм; – использование редактора множественного выравнивания последова- тельностей; – просмотр трехмерных моделей PDB и MMDB с поддержкой стерео- режима; – просмотр филогенетических деревьев; – применение конструктора вычислительных схем, автоматизирующего процесс анализа; – поддержку сохранения изображений в векторные форматы для удоб- ства публикаций. Ряд оригинальных компьютерных программ, баз и банков данных, соз- данных российскими учеными, можно также найти по разным поисковикам на других многочисленных сайтах по биоинформатике.

    ЗАКЛЮЧЕНИЕ Сегодня в биологии происходит глобальная смена модели науки. Еще недавно эксперимент подтверждал или опровергал те или иные гипотезы. 86 Информатика в науке и образовании Теперь же биология становится наукой, которая оперирует с данными, по- лучаемыми в промышленных масштабах. Использование методов биоинформатики позволяет ученым делать содержательные выводы, которые опираются на сопоставление разнородных данных или на объединение согласованных наблюдений. Хотя биоинформатике как науке всего лишь около 30 лет, в ней уже су- ществуют свои традиционные направления: компьютерный анализ ДНК, РНК и белковых последовательностей, реконструкция пространственных структур биополимеров, теоретический и компьютерный анализ структур- но-функциональной организации геномов и белков. Сюда же относится и развитие баз данных по молекулярно-генетической тематике, структуриро- ванию экспериментальных данных. Биоинформатика по своей сути – это интегративная наука, являющаяся инструментом в руках тех, кто занимает- ся биологией, молекулярной биологией, молекулярной генетикой, медици- онской генетикой, фармакологией, а также биохимией, биофизикой и т.д. Подводя итоги, можно сказать что биоинформатика это широко приме- няющийся и быстро развивающийся способ заниматься биологией, не на- блюдая живые существа, как зоологи, не делая опытов в пробирке, как в экспериментальной биологии, а анализируя результаты массовых данных или целых проектов, используя компьютерные технологии, можно делать совершенно конкретные, проверяемые биологические утверждения. Биоинформатика, геномика и протеомика – это науки о жизни, опреде- ляющие начало 21 века, так же как молекулярная биология, иммунология и биотехнология определяли конец 20 века. Не так давно биохимики тратили всю жизнь, чтобы определить структуру одного белка и выявить его функ- цию. С помощью методов биоинформатики можно предсказать функции тысячи белков. Таким образом, в триаде геномика–протеомика– биоинформатика по сути заложены все новые подходы к созданию принци- пиально новой медицины будущего: новые методы диагностики, новые лекарства, так как биоинформатика – это путь от гена к лекарству через структуру макромолекулы. Современное понимание биоинформатики приводит нас к мысли о том, что все те задачи, которые до недавнего времени решались биохимией и молекулярной биологией в реальных экспериментах, в будущем могут быть решены с той или иной степенью точности в виртуальных компью- терных экспериментах.
    http://www.iis.nsk.su/files/articles/sbor_kas_21_nesgovorova_bio.pdf

    http://evolgenomics.fbb.msu.ru/

    Биоинформа́тика — совокупность методов и подходов[1], включающих в себя:

    1. математические методы компьютерного анализа в сравнительной геномике (геномная биоинформатика).

    2. разработка алгоритмов и программ для предсказания пространственной структуры биополимеров (структурная биоинформатика).

    3. исследование стратегий, соответствующих вычислительных методологий, а также общее управление информационной сложности биологических систем[2].

    В биоинформатике используются методы прикладной математики, статистики и информатики. Биоинформатика используется в биохимии, биофизике, экологии и в других областях.

    Наиболее часто используемыми инструментами и технологиями в этой области являются языки программирования Java, C#, Perl, C, C++, Python, R; язык разметки — XML; базы данных — SQL; программно-аппаратная архитектура параллельных вычислений — CUDA; пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете —MATLAB, и электронные таблицы.


    написать администратору сайта