Молекулярные маркеры. МОЛЕКУЛЯРНЫЕ МАРКЕРЫ. ПРИЧИНЫ И ПОСЛЕДСТВИЯ ОШИБОК ГЕНОТИПИРОВАН. Молекулярные маркеры. Причины и последствия ошибок генотипирования
Скачать 60.84 Kb.
|
МОЛЕКУЛЯРНЫЕ МАРКЕРЫ. ПРИЧИНЫ И ПОСЛЕДСТВИЯ ОШИБОК ГЕНОТИПИРОВАНИЯ М.Е. Омашева, К.П. Аубакирова, Н.А. Рябушкина РГП «Институт биологии и биотехнологии растений», г. Алматы natrya7@yahoo.com АБСТРАКТ Молекулярные маркеры, в основу которых положена реакция гибридизации или этап ПЦР, выявляющие полиморфизм ДНК, используются в настоящее время в различных областях биологии, в том числе в изучении и сохранении генетического разнообразия, идентификации индивидуумов, филогенетике, картировании полезных признаков качества и устойчивости к стрессовым факторам, в селекционном процессе, биотехнологии и др. До начала эксперимента исследователи должны определить, какой тип маркеров использовать исходя из следующих критериев: вариабельность и количество требуемых маркеров, необходимость в их кодоминантности, соответствующие требования к выделяемой ДНК; практические – эффективность, воспроизводимость анализа, необходимое соответствующее техническое обеспечение и стоимость. Для корректной интерпретации результатов генотипирования следует учитывать тот факт, что применение любого типа молекулярных маркеров сопряжено с рядом ошибок генотипирования, главные из них – выпадение бóльших аллелей, «нуль» аллели, «stutter» аллели вследствие особенностей Таг-полимеразы, негомологичность амплифицированных последовательностей одинакового размера (гомоплазия). Исследователи формулируют определяющие условия для уменьшения количества ошибок при генотипировании и снижения их влияния на конечный анализ. В их числе качество и количество анализируемой ДНК, уровень технических возможностей и профессионализма персонала, поскольку человеческий фактор определяется как одна из главных причин некорректных результатов; проведение пилотных экспериментов для сравнительной оценки теоретического и реального коэффициента ошибки. Минимизирование ошибок достигается оценкой возможностей того или иного типа и скринингом маркеров; оптимизацией экспериментальных методов, надлежащим использованием контролей, повторностей, а также разработкой статистических подходов для выявления ошибок. Компромисс между выбраковкой локусов, порождающих ошибки и повышением потенциала оставляемых локусов для усиления генетического сигнала может быть различным в различных исследованиях, но главное, чтобы этот сигнал не был потерян в угоду «приемлемого» уровня ошибок и исследователи разрабатывают эмпирические подходы для достижения желаемого компромисса. Ключевые слова: молекулярные маркеры, генотипирование, ошибки генотипирования. РАЗНОВИДНОСТИ И ОСОБЕННОСТИ МОЛЕКУЛЯРНЫХ МАРКЕРОВ Прогресс в современной биологии в значительной степени базируется на развитии и использовании молекулярно-генетических подходов, в основе которых лежит анализ полиморфизма ДНК, выявляемый с помощью различных типов молекулярных маркеров. Молекулярные маркеры используются в настоящее время для генотипирования при оценке генетического родства/разнообразия между индивидами, сортами, для создания генетических карт, картирования генов интереса, в селекционном процессе (MAS, marker assisted selection), популяционной генетике, филогенетических исследованиях, биотехнологии и др. [1-5]. Эволюция молекулярных маркеров идет в направлении повышения разрешающей способности, быстроты, простоты и, по возможности, снижения стоимости анализа. Исследователями [6] сформулированы требования к ДНК маркерам, согласно которым идеальный молекулярный маркер должен отвечать комплексу характеристик: быть высоко полиморфным для выявления генетического разнообразия; иметь кодоминантное наследование, позволяя определять гомозиготное и гетерозиготное состояния диплоидных организмов; маркер должен случайно и часто быть распределен по геному; его проявление должно быть нейтральным (поскольку ДНК последовательности любого организма нейтральны к внешним условиям и осуществляемым процедурам); метод должен быть прост и дешев в использовании; высоко воспроизводим; должен позволять обмен результатами между лабораториями. Наличие нескольких типов маркеров объясняется тем, что ни один из них с высокой степенью не соответствует всей сумме перечисленных критериев. При этом очевидно, что особенности той или иной разновидности молекулярных маркеров обуславливают их более успешное применение для решения тех или иных задач. Исследователи перед началом эксперимента должны определить, какой тип маркеров использовать исходя из следующих критериев: вариабельность и количество требуемых маркеров, необходимость в их кодоминантности, соответствующие требования к растительному материалу и выделяемой ДНК, размер генома и плоидность таксона; практические – эффективность анализа, стоимость и соответствующее техническое обеспечение [7]. Более того, тенденцией современных исследований с привлечением молекулярных маркеров является использование двух и более типов маркеров (описание типов см. ниже), что приводит к более однозначным, достоверным результатам. Так, для понимания механизмов устойчивости V. amurensis к Agrobacterium с помощью RAPD маркеров в картирующей популяции винограда был выявлен локус устойчивости, на основе которого были разработаны сопряженные с устойчивостью SCAR маркеры. Однако, точную локализацию этих маркеров удалось выяснить с помощью SSR маркеров с использованием референсной карты [8]. В последние десятилетия разработаны типы молекулярных маркеров, в основу которых положена реакция гибридизации, таких как RFLP, и несколько типов, включающих этап ПЦР (RAPD, AFLP, SSR, SNP, CAPS, SCAR, маркеры на основе ретротранспозонов и др.). В обзоре [6] приведен список наиболее часто используемых молекулярных маркеров, приложения их использования, преимущества и недостатки, а также сравнительная оценка, основанная на ряде признаков. В их числе: требования к количеству и качеству ДНК, количество анализируемых полиморфных локусов, простота использования, возможность автоматизации процесса, воспроизводимость и стоимость. Ниже приведены наиболее часто используемые типы молекулярных маркеров. RFLP (restriction fragment length polymorphism; полиморфизм длины рестрикционных фрагментов) – первый метод молекулярных маркеров для профилирования ДНК. Метод основан на технике расщепления с помощью особых рестрикционных ферментов (эндонуклеаз рестрикции) молекул ДНК, различающихся в гомологичных участках и соответственно мест рестрикции, и сравнении длин полученных фрагментов различных видов и даже линий живых организмов. Полученные фрагменты разделяются электрофоретически. После переноса на мембрану они идентифицируются гибридизацией с радиоактивно мечеными пробами (Southern blotting). Гибридизация позволяет определять длины фрагментов, комплементарных пробам. Каждый фрагмент рассматривается как аллель и используется в генетическом анализе. Достаточная степень полиморфизма, кодоминантность, частота и равномерное распределение по геному, высокая воспроизводимость позволили использовать метод в ДНК профилировании, картировании генома, локализации генов, имеющих отношение к болезням, генотипировании, изучении филогенеза. Согласно PubMed данным (plant+RFLP), максимальное количество публикаций с использованием этих маркеров приходится на 2003-2005 гг. Определенные недостатки метода – необходимость больших количеств ДНК высокого качества, использование изотопов, продолжительность анализа и др. Соответствующее развитие более эффективных и дешевых типов маркеров к настоящему моменту существенно снизили использование RFLP анализа. Маркеры с использованием полимеразной цепной реакции (PCR) PCR (polymerase chain reaction; ПЦР, полимеразная цепная реакция) – использование термостабильной ДНК полимеразы для амплификации in vitro отдельных/специфических последовательностей или локусов ДНК с применением случайных или специфических праймеров (олигонуклеотидных последовательностей). Амплифицированные фрагменты разделяются электрофоретически и полосы (пики) выявляются окрашиванием или радиоавтографией. Предпочтение методов генотипирования с использованием ПЦР обусловлено, прежде всего, потребностью в реакции небольших количеств ДНК (5-100 нг образца на реакцию). Открытие и разработка полимеразной цепной реакции создали возможности для дизайна широкого спектра молекулярных маркеров. Развитием RFLP анализа явился метод CAPS (cleaved amplified polymorphic sequence) – амплификация в ПЦР последовательностей, вырезаемых по месту рестрикции соответствующих узнаванию рестриктазой нуклеотидных последовательностей полиморфных гомологичных участков. Различия проявляются в легко различимых по длине продуктов - фрагментов ДНК при электрофорезе. CAPS маркеры являются кодоминантными и позволяют выявлять полиморфизм в большом количестве индивидуумов. Например, разработка CAPS маркеров на основе последовательностей определенных генов и EST последовательностей позволила исследователям создать соответствующие пары праймеров, с помощью которых была установлена подлинность 67 сортов чая (95%), культивируемых в Японии [9]. Данный тип маркеров помогает выявлению недавней эволюционной истории, пониманию направления эволюционного процесса, обуславливающего видообразование [10]. Разработка и использование CAPS маркеров способствует более точному картированию генов интереса, в том числе устойчивости к патогенам [11, 12]. RAPD (random amplified polymorphic DNA; амплифицируемые ДНК фрагменты) – метод амплификации ДНК сегментов с использованием случайных праймеров (примерно 10 нуклеотидов) не требует предварительного знания последовательности ДНК, однако вследствие стохастической природы ДНК амплификации важна оптимизация и поддержание соответствующих условий для получения воспроизводимых результатов. Метод используется, например, для изучения близкородственных видов и молекулярной идентичности растений, размножаемых in vitro [13, 14, 15]. Недостатками метода являются: доминантность, не очень хорошая воспроизводимость и необходимость высокоочищенной неконтаминированной ДНК, поскольку использование коротких случайных праймеров может приводить к амплификации фрагментов различных организмов; локус-неспецифичность маркеров и негомологичность фрагментов одинакового размера (homoplasy). Вследствие недостаточной воспроизводмиости RAPDs сложно использовать в межлабораторных исследованиях. Вследствие вышеупомянутого значимость получаемых результатов и их интерпретация могут подвергаться сомнению. На основе полученных с использованием случайных праймеров RAPD бэндов, их разделения, экстрагирования, клонирования и секвенирования и дизайна специфических праймеров разработан тип маркеров SCAR (sequence characterized amplified region, характерная последовательность амплифицируемого участка), развитие и использование которых экспоненциально растет с начала 1990-х годов. Так, разрабатываются специфические SCAR маркеры, позволяющие дискриминировать определенные молекулярные фенотипы различных видов одного рода [16], используемые в таксономии [17] дискриминирование экотипов [18], выявление уникальных сомаклональных вариантов и молекулярных событий, сопряженных с вариабельностью сомаклонов [19]. Подобный тип маркеров обладает потенциалом, в селекции [20] позволяет различать определенные патогенные штаммы микроорганизмов [21] и др. AFLP (amplified fragment length polymorphism; амплификация полиморфных по длине фрагментов ДНК) – метод селективной ПЦР амплификации полиморфных по длине фрагментов, полученных в результате энзиматического расщепления геномной ДНК эндонуклеазами рестрикции. К полученным после рестрикции фрагментам для селективной амплификации «пришиваются» олигонуклеотидные адаптеры. Таким образом, праймеры состоят из адаптера и последовательности нескольких нуклеотидов (1-5), специфичных для узнавания ферментом рестрикции. Полиморфизм фрагментов по длине (обычно несколько десятков на реакцию), обусловленный множеством геномных сайтов рестрикции, выявляется при электрофорезе. Воспроизводимость и высокое количество информативных фрагментов в реакции позволяет использовать метод в различных аспектах: изучение генетической идентичности, идентификация сортов и клонов, филогенетические связи, картирование, MAS и др. Реализация метода требует высокого качества ДНК. Хотя использование AFLPs, как и RAPDs, не требует предварительного знания ДНК последовательностей, эти типы маркеров сложно использовать при изучении различных популяций или даже видов. Недостатками AFLPs являются доминантность аллелей, возможная негомологичность одинаковых по длине фрагментов – гомоплазия. В случае вставки между соседними местами рестрикции наблюдается утрата короткого фрагмента и появление более длинного. При использовании доминантных маркеров, например, в диплоидах один бэнд имеет место в случаях, если одна или обе гомологичные хромосомы содержат амплифицируемую последовательность, т.е. невозможно различить гомо- и гетерозиготы. В полиплоидах неясность усугубляется, поскольку даже в случае выявления определенного бэнда тем более трудно сказать, в каком количестве аллель присутствует [22]. Тем не менее, использование AFLP маркеров в течение последнего десятилетия (PubMed) практически не снижалось. Метод используется при изучении эволюционных и экологических аспектов живых организмов, при сохранении видов. Микросателлиты (SSR, simple sequence repeat; тандемы повторов простых последовательностей) – участки ДНК, состоящие из тандемов повторяющихся единиц: моно-, ди-, три-, тетра- или пента-нуклеотидов [23]. Микросателлиты присутствуют как в некодирующих, так и в кодирующих областях генома, а также в хлоропластном [24] и митохондриальном геномах [25]. Естественными причинами разнообразия в количестве повторов единиц микросателлитов в геноме являются «проскальзывание» (slippage) полимеразы в ходе репликации ДНК, и/или несоответствующий кроссинговер, несовпадение/восcтановление повреждений двойной нити ДНК, а также перемещения ретротранспозонов. Эти вариации приводят к полиморфизму по длине фрагментов, выявляемых при электрофорезе [26]. Этот тип генетических маркеров приобрел в последнее десятилетие большую значимость благодаря комплексу свойств: гипервариабельность, мультиаллельная природа, кодоминантное наследование, высокая воспроизводимость, относительное обилие, экстенсивное распределение по геному, высокая пропускная способность, податливость автоматизации процесса. Микросателлиты используются при изучении филогеографии, структуры популяций, сортовой идентификации, выявлении источника происхождения (отцовства). По сравнению с SSR использование RAPD недостаточно воспроизводимо, тогда как RFLP не обладают высокой пропускной способностью, а AFLP осложнен тем, что индивидуальные полосы могут состоять из нескольких фрагментов, идентичных по размеру, особенно в больших геномах. Хотя и для SSR гомоплазия, связанная с высокой скоростью мутаций и возможностью обратных мутаций, может быть определенной проблемой. Одним из недостатков SSR маркеров является стоимость их разработки, поскольку для создания праймеров необходимо клонирование и секвенирование произвольных участков ДНК, выявление микросателлитных повторов и определение фланкирующих областей таких участков генома для определения специфического локуса. Микросателлиты могут быть разработаны на основе геномных библиотек ДНК или библиотек, обогащенных для специфических микросателлитов. Некоторые микросателлиты могут быть не просто ди-, три-, или тетра-повторами, а составными повторами, в которых возможен полиморфизм по одному нуклеотиду. Эти аллели различаются на 1 пару нуклеотидов и требуют особого внимания при генотипировании. Аллельные различия в размерах микросателлитов, на которых и основано их использование, в то же время могут обусловить ошибки при амплификации и, соответственно, ошибочной интерпретации генотипирования при оценке генетического разнообразия, структуры популяций, родословной и др. Исследователи показали, что количество ошибок при использовании микросателлитов прямо коррелирует с размером ПЦР продукта [27]. EST-SSR (ESTs, expressed sequence tag, короткие фрагменты последовательностей клонированных участков ДНК (mRNA→cDNA)), которые используются для идентификации транскриптов генов, могут быть источниками для выявления SSRs, т.е. для поиска микросателлитов в экспрессируемых участках генома [28]. Поскольку EST последовательности консервативны, межвидовая EST-SSRs ПЦР амплификация, возможно, более успешна, чем SSRs геномной ДНК. Этот тип маркеров представляет интерес, поскольку их разработка недорога, они отражают транскрибируемые гены, чьи предполагаемые функции зачастую могут быть определены с помощью выявления гомологии. Но качество SSR-EST последовательностей очень важно, поскольку дизайн праймеров может быть осложнен рядом обстоятельств: распространением одного или обоих праймеров на участки сплайсинга; наличием больших интронов в последовательности геномной ДНК, использованием «неполноценной» (questionable) информации относительно создания праймера, и созданием праймеров для химерных cDNA клонов. Таким образом, дизайн праймеров успешен на 60-90%. К началу 2013 г. в базах данных (GenBank) доступны более 74 млн. ESTs. Однако создание генных микросателлитных маркеров ограничено теми видами, для которых имеется достаточно большое количество ESTs. С помощью определенных компьютерных программ данные последовательностей ESTs, генов и cDNA клонов могут быть загружены из GenBank и сканированы на выявление SSRs [табл. 1 в 28]. Приложения использования данного типа маркеров – функциональный геном, ассоциативное картирование, анализ генетического разнообразия, анализ количественных признаков и др. EST-SSR маркеры могут способствовать эволюционному анализу широкого представительства таксонов, анализу видов, ресурсы которых крайне ограничены [29]. Продуктами EST-SSR маркеров являются четкие бэнды, отчетливые аллельные пики [28]. Поскольку эти маркеры являются производными транскриптов, они могут быть использованы для оценки функционального разнообразия естественных популяций или коллекций гермоплазмы. Особенно в случаях маркирования генов, ответственных за фенотипические признаки, эти маркеры полезны для использования в селекции. Как было упомянуто выше, на основе EST-последовательностей разрабатываются и CAPS маркеры. ISSR (inter-simple sequence repeat, область генома между двумя соседними, противоположно ориентированными микросателлитами) – в качестве праймеров используется последовательность сердцевинной части микросателлита с несколькими (1-3) нуклеотидами, примыкающими к тандему повторностей. Десятки фрагментов множества локусов, полученных в ПЦР, разделяются электрофорезом и оцениваются на присутствие или отсутствие (вследствие доминантности маркеров) фрагментов определенного размера. Главное преимущество данного типа маркеров – отсутствие необходимости знания последовательностей при конструировании праймеров. Следует учитывать, что вследствие мультилокусности возможна гомоплазия. Маркеры данного типа используются для выявления генетической идентичности, родословной, дифференциации клонов, микроклонов и линий, таксономии близкородственных видов. SNP (single-nucleotide polymorphism; полиморфизм по одному нуклеотиду) – маркеры данного типа становятся все более используемыми в исследованиях генома. Техника основана на том, что в организмах изменения в одном нуклеотиде приводят к точечным мутациям, обуславливая тем самым полиморфизм по одному нуклеотиду (диаллельный тип маркеров). Для создания специфических праймеров необходимо знание последовательностей и фланкирующих областей. Несмотря на высокую стоимость, использование метода в последние годы возрастает. Поскольку метод позволяет автоматизированно осуществлять высокоразрешающее генотипирование с одновременным использованием большого количества SNP маркеров; присутствие многих тысяч проб на чипе позволяет одновременно анализировать множество SNPs. Но в то же время различие аллелей только по одному нуклеотиду и множество проб делает невозможным создание оптимальных условий гибридизации для всего массива проб. Это в ряде случаев приводит к гибридизации анализируемой ДНК с несоответствующими пробами. Оценка большого объема данных становится серьезной проблемой, так как не представляется возможным предпринять point-by-point оценку обоснованности тех или иных данных [30]. Поскольку применение SSR и SNP маркеров постоянно возрастает, исследователи провели сравнительную характеристику этих двух типов маркеров [31]. Так SSRs имеют следующие преимущества перед SNPs. В SSR локусах превышение на определенное количество повторностей может рассматриваться как полиморфизм, в то время как для идентификации SNPs гомологичных областей должны быть сиквенированы области многих хромосом. SSRs обладают несущественной необъективностью, т.е. оценка полиморфизма с их помощью не зависит от исходного перечня сортов. Успех SSR амплификации близкородственных сортов выше, чем для SNP. Локусы SSRs более действенны для выявления смесей, чем SNPs. Достоверность SSR генотипирования оценить легче, поскольку бóльшая доля ошибок может быть выявлена при анализе родословной, когда имеет место много аллелей на локус, тогда как для биаллельных SNPs многие ошибки при анализе не выявляются, поскольку они следуют правилам Менделевского наследования. Очевидно, имеют место и недостатки SSR по сравнению с SNP. Так, большое количество аллелей на SSR локус подразумевает анализ большого количества образцов. Более частые спонтанные SSR мутации внутри родословной потенциально осложняют реконструкцию происхождения; обратные мутации затрудняют описание длительной истории популяций. Вариабельность высокополиморфных микросателлитов может некорректно отражать геномное разнообразие. Микросателлиты требуют включения контролей, в то время как использование SNPs может осуществляться параллельно в ряде лабораторий без необходимости калибровки результатов. Очевидно, что разработка и использование различных типов молекулярных маркеров основаны на выявлении изменений в геномных последовательностях, что в свою очередь предполагает, в том числе, экстинцию (выпадение) и последующую вставку последовательностей ДНК. Причиной этих событий могут быть ретротранспозоны (РТ). РТ являются неотъемлемой и довольно значительной частью генома всех живых организмов. Маркеры на основе РТ успешно используются для анализа генетических взаимосвязей, филогенеза, видового разнообразия, при создании генетических карт и идентификации генов [32, 33, 34, 35]. Вездесущая природа РТ и вовлеченность в создание геномного разнообразия посредством интеграции больших сегментов ДНК в рассредоточенные локусы хромосом делают их идеальными для создания на этой основе нескольких типов молекулярных маркеров. Так, IRAP (inter-retrotransposon amplified polymorphism) генерирует ПЦР продукты между двумя близлежащими РТ. REMAP (retrotransposon-microsatellite-amplified polymorphism) использует один LTR (long terminal repeat) праймер и другой «присоединенный» к 3’концу SSR последовательности, выявляя РТ, интегрированные поблизости этой SSR последовательности. iPBS амплификация основана на присутствии в сайте связывания праймера обратной транскриптазы в области LTR РТ. SSAP (sequence-specific amplified polymorphism) является производным AFLP, амплифицируя продукты между местом интеграции РТ и местом рестрикции, к которому «привязан» адаптер. |