биоинформатика. курсач. Методы для поиска в данных практической информации
Скачать 16.38 Kb.
|
Биоинформатика включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных. Вычислительные биологи – это специалисты, которые специализируются на решение биологических задач, при помощи вычислительных систем и инструментов. Основными направлениями биоинформатики являются: биоинформатика последовательностей (поиск последовательностей в геноме человека), анализ экспрессий (анализ того, как наследственная информация от участка ДНК преобразуется в РНК или белок), структурная биоинформатика (анализ и предсказание трехмерной структуры белка, РНК и ДНК). В биоинформатике применяются прикладная математика, статистика, информатика и другие предметы. Биоинформатика востребована в разных областях, таких как: биохимия, биофизика, генетика, экология и другие. Специалист работающий по профессии биоинформатик должен владеть различными языками программирования, владеть языками запросов к базам данных, обладать умением в структурирование и анализе данных. Главной целью биоинформатики является понимание и предсказывание биологических процессов. При этом используются и создаются интенсивные вычислительные методы такие как: распознавание предметов, процессов, сигналов и так далее в различных биологический процессах, методы для поиска в данных практической информации, машинное обучение, визуализация биологических данных, и другие. Основные усилия направлены в следующие области: анализ генетических полседовательностей, аннотация геномов, вычислительная эволюционная биология, оценка биологического разнообразия. Анализ генетических последовательностей – это сравнение генома в рамках одного или нескольких видов, с целью нахождения одинаковых фрагментов. При помощи этого метода составляются филогенетические деревья, которые показывают эволюционные взаимосвязи между различными видами. Так как при поиске схожих фрагментов генома приходится анализировать тысячи различных генов, состоящих из миллиардов пар нуклеотидов, приходится использовать специальные программы. Данные программы могут достаточно точно сопоставить похожие последовательности ДНК в геномах разных видов. При этом части такие последовательности могут иметь мелкие мутации, выраженные заменой, вставкой или выпадением отдельных нуклеотидов. В данном случае помогает машинное обучение, которое обучаясь на уже расшифрованных участках ДНК разных видов, понимает, где мутации, а где – нет. Аннотация геномов – процесс маркировки генов и других объектов в последовательности ДНК. Специалисты, опираясь на уже известные функции генов, декодируют другие части генома. При этом так же применяются специальные программы, зачастую с использованием нейросетей. Вычислительная эволюционная биология - раздел биологии, исследующий происхождение и появление видов, а так же их развитие. При этом используются следующие инструменты: изучение эволюции большого числа организмов, путем анализа изменений ДНК, а не только изменение строения или физиологии, сравнение генома, что дает информацию о эволюционных событиях, таких как хромосомные перестройки или же удвоение хромосом, передача генетического материала организму-непотомку и так далее, создание компьютерных симуляций, чтобы предсказывать как поведет себя система в будующем. Благодаря этому разделу можно проследить как изменялся тот или иной вид, а так же визуализировать возможные варианты, как будет изменятся вид в будущем. Оценка биологического разнообразия – метод, при помощи которого определяют полную генетическую совокупность среды (капля воды, горсть земли, вся биосфера планеты Земля или живой организм), состоящую из всех обитающих видов. Для структурирования используются базы данных, а далее это визуализируется и анализируется. Так же при помощи специального компьютерного обеспечения симулируют модели популяционной динамики или вычисляют общее генетическое здоровье культуры, что может быть полезным агрономам. Один из важнейших потенциалов этой области – анализ последовательностей ДНК вымирающих видов для предотвращения этого в будущем или использовать результаты генетического эксперимента природы, если вид уже вымер. Таким образом, биоинформатика – область науки, востребованная начиная от медицины, заканчивая сельским хозяйством, без которой другие науки не смогли бы существовать. |