перевод_статья_5. Исследование (gwas) агрономических признаков и содержания фенолов в генотипах сорго (Sorghum bicolor. L)
Скачать 1.02 Mb.
|
Рисунок 1. Профили фенольных соединений с помощью ультраэффективной жидкостной хроматографии (UPLC) были обнаружены при 320 нм для самой высокой линии TPC и их исходного сорта в сорго. (A) IS645, исходный сорт; (Б) ИС645-2; 1 диглюкозид лютеолинидина; 2 лютеолин глюкозид; 3 апигенинидин глюкозид; 4 лютеолинидин; 5 апигенинидин, 6 5-O-Me- лютеолинидин. Рисунок 2. Трехмерные профили фенольных соединений с помощью ультраэффективной жидкостной хроматографии (UPLC). Верхняя цифра — это минимальное значение идентификации, а нижняя цифра — максимальное значение идентификации. (А) Икумба. (Б) Сорго-медовое и др. (В) Дансусу2- 10. (Г) Пахат-4. (Э) Дансусу2-12. (F) Дансусу2-12. (Г) Пахат-4. (H) Банволданг. (I) Пахат-5. (Дж) Битжару. (K) Горно-сладкий. (Л) Битжару. (M) Горно- сладкий. (Н) IS645. Таблица 3. Сводка общего содержания фенолов и шести фенольных соединений в 96 генотипах 223 сорго, использованных в этом исследовании 3.3. Корреляционный анализ Чтобы сравнить корреляцию между агрономическими и фитохимическими признаками, мы проанализировали коэффициент парной корреляции Пирсона между четырьмя агрономическими признаками (HD, PH, SC и DY) и фитохимическими соединениями (TPC, лютеолинидин диглюкозид, лютеолин глюкозид, апигенидин глюкозид, лютеолинидин, апигенинидин и 5-O-Me-лютеолинидин) в 96 линиях сорго (рис. 3). Сильные положительные корреляции были показаны между PH и DY (r = 0,60, P <0,001), HD и PH (r = 0,40, P <0,001). Слабые положительные корреляции были показаны между SC и DY (r = 0,23, P < 0,01). При сравнении корреляций между TPC и шестью фенольными соединениями они в целом показали положительную корреляцию, за исключением корреляций между глюкозидом лютеолина и диглюкозидом лютеолинидина. Сильные положительные корреляции наблюдались между ТФХ и лютеолинидином (r = 0,82, P <0,001), апигенинидин-глюкозидом и апигенинидином (r = 0,79, P <0,001) и лютеолинидином и апигенинидином (r = 0,75, P <0,001). Диглюкозид лютеолинидина отрицательно коррелировал с ЛГ (r = -0,37, P <0,001) и HD (r = -0,36, P <0,001). Рисунок 3. Корреляционный анализ между отдельными агрономическими признаками и фенольными соединениями. HD (дата заголовка); РН (высота растения); СК (содержание растворимых твердых веществ); DY (сухой выход); TPC (общее содержание фенолов). *, ** и *** значимы при уровнях вероятности 0,05, 0,01 и 0,001 соответственно. 3.4. Генотипирование путем секвенирования генотипов сорго Библиотека GBS была создана из 37 генетических ресурсов и 59 мутантных линий сорго, которые были секвенированы с использованием платформы Illumina HiSeq X Ten. Сводка этих результатов секвенирования представлена в таблице 4. Всего было сгенерировано 684 миллиона ридов, содержащих 103 348 422 063 нуклеотида (103,3 Гб), в среднем 7,1 млн ридов (1,0 Гб) на генотип. После удаления некачественных последовательностей осталось 620 196 808 чистых прочтений, в среднем 6,4 миллиона прочтений на генотип. Общий диапазон чистых чтений составлял от 98,4 МБ до 2818,9 МБ, при этом средняя длина чтения составляла 673,3 МБ. Общее количество сопоставленных прочтений составило 599 168 188 во всех строках, в среднем 6 241 335 прочтений на образец. Сопоставленные показатели чтения (%) варьировались от 91,76% до 97,84%. В среднем 96,69% отфильтрованных прочтений были сопоставлены с эталонной последовательностью генома. Общая длина картируемой области составила 4968,2 Мб, в среднем 51,7 Мб на образец, что покрывает примерно 7,09% последовательности эталонного генома. Среди 96 линий средняя глубина закартированной области колебалась от 4,00 до 16,37 (таблица S1). Таблица 4. Сводка данных последовательности GBS и сопоставление с эталонной последовательностью генома. Mapped reads on reference genome 1 1 Справочный геном; Сорго двухцветное Рио _v2. 3.5. Идентификация SNP SNP для каждой линии были выбраны из отфильтрованных SNP в положении матрицы между линиями сорго и эталонной последовательностью генома (таблица S3). В общей сложности 10 369 812 SNP варьировались от 22 737 (IS2868-1) до 201 950 SNP (IS14131), в среднем 108 019 SNP. В общей сложности 192 040 SNP были идентифицированы в генотипах 96 линий сорго с использованием подхода GBS (таблица 5). Длина хромосом колебалась от 60 миллионов (хромосома 9) до 89 миллионов (хромосома 2). Количество SNP варьировало от 13 830 (хромосома 7) до 25 265 (хромосома 1). Самая высокая плотность SNP наблюдалась на хромосоме 1 с 310,0 маркерами SNP на 1 Мб, тогда как наименьшая плотность была на хромосоме 7 с 196,8 маркеров SNP на 1 Мб. Средняя плотность составила 246,7 маркеров на 1 Мб. Самая высокая частота SNP наблюдалась на хромосоме 7 с 5,08 т.п.н. на SNP, тогда как самая низкая частота была на хромосоме 1 с 3,23 т.п.н. на SNP. Средняя частота составила 5,06 т.п.н. на SNP. SNP в линиях сорго были функционально аннотированы с использованием эталонной последовательности генома. Большинство SNP (82 279; 42,84%) находились в генных регионах, но несколько — в межгенных регионах (109 761; 57,16%). По области гена распределение SNP в экзоне, CDS (35 499; 43,14%), интронах (31 041; 274 37,73%), экзоне (14 727; 17,90%), экзоне и интроне (517; 0,63%), и определяли экзон, CDS и интрон (495; 0,60%) (таблица S4). Таблица 5. Хромосомное распределение и частота SNP, идентифицированных с использованием подхода GBS в 96 генотипах сорго. 3.6. GWAS-анализ агрономических признаков В общей сложности 34 значимых SNP (-log10(p) > 4,0) были обнаружены в трех агрономических признаках (HD, PH и DY) для 96 генотипов сорго с использованием GWAS-анализа комбинированного набора данных GBS (таблица S5). В СК не выявлено значимого SNP со значением -log10(p) более 4,0. Из 34 значимых SNP девять SNP (HD, четыре SNP, PH, три SNP и DY, два SNP) были обнаружены совместно более чем в двух моделях (таблица 6, рисунок S1). Мы аннотировали важные SNP в HD, PH и DY. Четыре SNP для HD (-Log10 (P) = 4,15-4,93), которые были расположены в экзоне и CD на хромосомах 2, 6 и 10 были SB02_6876523, SB02_6876524 (SBRIO.02G064100; Benzyl Altugle Obenzoyltrasferase), SB06_87054 .06G036000; изоформа X2, подобная эндо-1,4-бета-ксиланазе 4), и Sb10_7471984 (SbRio.10G099600; изоформа X2, подобная галактозид2-альфа-L-фукозилтрансферазе). 3 SNP для PH (-log10(p) = 4,12 – 11,70) располагались в экзоне и CDS на хромосомах 7, 8 и 9: Sb07_53523852 (SbRio.07G123800; nudix hydrolase 15, митохондриальная), Sb08_63291752 (SbRio.08G1). 41500; гипотетический белок BDA96_08G141500) и Sb09_50399847 (SbRio.09G149200; гипотетический белок BDA96_09G149200). Два SNP для DY (-293 log10(p) = 4,20–6,82) были расположены в интроне, экзоне и CDS на хромосомах 4 и 8; 294 Sb04_2143594 (SbRio.04G031300; бета-амилаза 8 изоформа X2) и Sb06_62687750 (SbRio.06G211400; транскрипционный фактор MafB). Из девяти SNP, связанных с агрономическими признаками, Sb10_7471984 был единственным, обнаруженным совместно во всех четырех моделях GWAS. Влияние аллеля оценивали по SNP-маркеру с наименьшим p-значением для каждого агрономического признака. Ассоциированный с БХ SNP-маркер Sb10_7471984 на хромосоме 10 имел аллели A/G, а средний БХ для лиц с аллелями GG составлял 84 дня, что на 15 дней короче, чем средний БХ для лиц с аллелями АА (99 дней). PH-ассоциированный SNP-маркер Sb09_50399847 на хромосоме 9 имел аллели G/A, а средний PH для лиц с аллелями AA составил 305 см, что на 134 см больше, чем средний PH для лиц с аллелями GG (171 см). . Ассоциированный с DY SNP-маркер Sb04_2143594 304 на хромосоме 4 имел аллели G/C, а средняя DY для особей с аллелями СС составила 11,60 т/га, что на 7,58 т/га легче, чем средняя DY для особей с аллелями GG. (19,18 т/га) (рис. 4). Таблица 6. Информация о совместно обнаруженных SNP для агрономических признаков (HD, PH и DY) по результатам GWAS. 1 HD (дата заголовка); РН (высота растения); DY (сухой выход); 2 MAF (минорная частота аллеля); 3 Метод 1–4 относится к BLINK (1); ЦП фермы (2); МЛММ (3); МЛМ (4); 4 Эталонный геном; Сорго двухцветное Рио _v.2.1. Рис. 4. Фенотипические различия между линиями с разными аллелями (слева — эталонный геном; справа — альтернативный геном) по SNP, связанным с датой колошения (HD); высота растения (PH); сухой выход (DY). *, ** и *** значимы при уровнях вероятности 0,05, 0,01 и 0,001 соответственно. 3.7. GWAS-анализ общего содержания фенолов Всего было обнаружено 117 значимых SNP (-log10(p) > 4,0) в TPC и 6 фенольных соединениях (лютеолинидин диглюкозид, лютеолин глюкозид, апигенидин глюкозид, лютеолинидин, апигенинидин и 5-O-Me лютеолинидин) для 96 генотипов сорго. с использованием анализа GWAS комбинированного набора данных GBS (таблица S6). Из 117 значимых SNP 31 SNP (TPC; шесть SNP, лютеолинидин диглюкозид; восемь SNP, лютеолин глюкозид; четыре SNP, апигенидин глюкозид; восемь SNP, лютеолинидин; три SNP; и 5-O-Me лютеолинидин; два SNP). - обнаружен более чем в двух моделях и включает два фенольных соединения (таблица 7, рисунок S1). Мы аннотировали важные SNP TPC и пяти фенольных соединений. В случае апигенинидина SNP не были идентифицированы как обнаруженные совместно более чем в двух моделях. Три SNP для TPC (-log10(p) = 4,03 – 14,04) были расположены в интроне, экзоне и CDS на хромосомах 2 и 4: Sb02_81797062 (SbRio.02G343600; рецептор этилена 4), Sb04_1305322 (SbRio.04G019000; холин/ этаноламинфосфотрансфераза 1) и Sb04_64461978 (SbRio.04G361300; белок семейства гликозилтрансфераз 2). 7 SNP для диглюкозида лютеолинидина (-log10(p)= 4,04–22,41) были расположены в интроне, экзоне и CDS на хромосомах 2, 4 и 6: Sb02_79905727 (SbRio.02G316600; NEP1- взаимодействующий белок, подобный 1), Sb04_59016630 (SbRio.04G289300; белковоподобная изоформа X1, богатая глутаминовой кислотой) и Sb06_59065337, Sb06_59065351, Sb06_59065380, Sb06_59065407 (SbRio.06G167800; ассоциированный со стенкой рецептор киназа 4). Четыре SNP для глюкозида лютеолина (-log10(p) = 4,01–4,27) были расположены в экзоне и CDS на хромосомах 1, 3 и 5; Sb01_14431763 (SbRio.01G175100; белок суперсемейства повторов ARM, кальций-транспортирующая АТФаза 3; типа плазматической мембраны); Sb03_4939603 (SbRio.03G056200; гипотетический белок BDA96_03G056200) и Sb05_9038134, Sb05_9038126 (SbRio.05G076500; вероятная киназа CHARK). Восемь SNP для глюкозида апигенинидина (-log10(p) = 4,08–11,40) были расположены в интроне, экзоне и CDS на хромосомах 1, 3, 6 и 10; Sb01_1229036, Sb01_1229046 (SbRio.01G011000; малый ядерный рибонуклеопротеин A' U2), Sb03_68395304 (SbRio.03G375900; ruvB-подобный белок 1), Sb03_68358847, Sb03_6835881 5, и Sb03_68358771 (SbRio.03G375100; белок GPR107), Sb06_55785073 (SbRio.06G125400; белок устойчивости к болезням Pik-1) и Sb10_4609482 (SbRio.10G064200; протеасомная субъединица альфа типа-4-2). Один SNP для лютеолинидина (-log10(p) = 4,23–4,98) располагался в экзоне на хромосоме 2; Sb02_81797139 (SbRio.02G343600; рецептор 4 этилена). Два 347 SNP для 5-O- Me лютеолинидина (-log10(p) = 4,23–7,23) были расположены в интроне, экзоне и CDS на хромосомах 6 и 8: Sb06_68347889 (SbRio.06G295300; множественный РНК-связывающий домен, содержащий белок 1) и Sb08_65531987 (SbRio.08G160200; Os04g0380500). Примечательно, что в общей сложности было идентифицировано четыре SNP, которые вносят вклад в два фенольных соединения, три из которых вносят вклад в TPC и лютеолинидин, а один - в TPC и диглюкозид лютеолинидина (таблица S6). SNP Sb02_81796960, Sb02_81797062 и Sb02_81797139, которые вносят вклад одновременно в TPC и лютеолинидин, были расположены на 81 796 960–81 797 139 п.н. и кодируют гены-кандидаты SbRio.02G343600, которые функционируют как рецептор этилена 4. SNP Sb0 4_56584914, которые вносят вклад одновременно в TPC и диглюкозид лютеолинидина. расположен на 56 584 914 п.н. и кодирует гены-кандидаты SbRio.04G259800, которые функционируют как субъединица альфа-1 компонента пируватдегидрогеназы E1, митохондриальная. Эффекты аллелей были оценены для SNP-маркеров, при этом самые низкие p-значения были получены для SNP, задействованных в двух соединениях. SNP-маркер Sb04_56584914, ассоциированный с лютеолинидиндиглюкозидом, на хромосоме 4 имел аллели C/G, а средние значения ТФС и лютеолинидиндиглюкозида для лиц с аллелями GG составляли 5,98 и 0,21 мг/100 г, что составляло 3,46 и 0,11 мг/100 г. ниже, чем средние ТФХ и лютеолинидин диглюкозида для лиц с аллелями СС (ТФХ; 9,44 мг/100 г, лютеолинидин диглюкозида; 0,32 мг/100 г) соответственно. ТФХ и связанный с лютеолидином SNP-маркер Sb02_81797062 на хромосоме 2 имели аллели A/G, а средние ТФХ и лютеолинидин для лиц с аллелями GG составляли 5,82 и 1,38 мг/100 г, что было на 1,30 и 0,54 мг/100 г ниже, чем у лиц с аллелями GG. средние ТФХ и лютеолинидин для лиц с аллелями АА (ТФХ; 7,12 мг/100 г, лютеолинидин, 1,92 мг/100 г) (рис. 5), соответственно, для аллелей АА. Таблица 7. Информация об SNP, обнаруженных в двух или более моделях GWAS или участвующих в двух или более соединениях для TPC и пяти фенольных соединениях (лютеолидиндиглюкозид, лютеолинглюкозид, апигенинидинглюкозид, лютеолинидин и 5-O-Me лютеолинидин) по результатам GWAS . 1 Признак 1–6 относится к ТПК (1); лютеолинидин диглюкозид (2); лютеолин глюкозид (3); апигенинидин глюкозид (4); лютеолинидин (5); 5-O-Me- лютеолинидин (6); 2 MAF (минорная частота аллеля); 3 Метод 1–4 относится к BLINK (1); ЦП фермы (2); МЛММ (3); МЛМ (4); 4 Эталонный геном; Сорго двухцветное Рио_v.2.1. Рис. 5. Фенотипические различия между линиями с разными аллелями (слева — эталонный геном; справа — альтернативный геном) по SNP, участвующим в двух или более соединениях в ТФХ и фенольных соединениях. *, ** и *** значимы при уровнях вероятности 0,05, 0,01 и 0,001 соответственно. Урожайность и качество сортов сорго улучшились благодаря современным концепциям и технологиям селекции. Однако существует острая необходимость в ускорении селекции биоэнергетических или биопластичных сортов сорго, обладающих высокой биомассой, эффективностью преобразования энергии, сахаристостью и сочностью [1-4]. Удовлетворение промышленных требований по выходу биомассы сорго требует высокого содержания сахара, и это было признано различными селекционерами [2,3]. Мутационная селекция стала мощным инструментом для создания элитных сортов за счет увеличения генетической изменчивости с точки зрения как качественных, так и количественных признаков [40]. Мутационная селекция на основе радиации может улучшить широкий спектр агрономических характеристик сорго, включая дату колошения, зрелость семян и другие признаки, связанные с урожайностью [41]. Предыдущие исследования по мутационной селекции показали, что гамма-лучи могут успешно вызывать мутации количественных признаков сорго, таких как повышение урожайности зерна и биомассы, а также повышение пищевой ценности пищевых продуктов и качества кормов [42]. В нашем исследовании мы обнаружили, что линии DINE-A-MITE-1 (PH), IS645-3 и Moktak-2 (DY) демонстрируют высокую продуктивность биомассы. Эти данные свидетельствуют о том, что эти мутантные линии могут служить ценным материалом для создания новых сортов сорго. HD, PH, SC и DY являются важными агрономическими характеристиками, которые влияют на практическую селекцию и урожайность сорго. В этом исследовании мы наблюдали HD (58,0–115,0 дней), PH (89,0– 465,0 см), SC (5,0–18,8° по шкале Брикса) и DY (2,37–26,07 т/га) в 37 генетических ресурсах сорго и 59 мутантных линиях. (Таблица 1). В предыдущем исследовании Kawahigashi et al. (2013) HD (64,0–114,0 сут), PH (68,2–342,4 см) и SC (2,2–20,5° по шкале Брикса) отмечены у 109 образцов сорго из Индии и Японии [4]. Кроме того, Ширингани и Фридт (2011) в своем исследовании сообщили о диапазоне DY от 2,56 до 15,86 тонн на га, что указывает на то, что агротехнические характеристики тесно связаны с биомассой сорго [2]. В нашем исследовании мы отобрали линии сорго с превосходными агрономическими характеристиками, чтобы они служили источниками высокой биомассы. Высота растений и время цветения уже рассматривались при выращивании зернового сорго в умеренных широтах, и были идентифицированы важные локусы QTL и/или гены, контролирующие РН и цветение, но взаимосвязь между РН, реакцией на фотопериод и развитием сорго плохо изучена [43]. ,44]. Кроме того, сложная наследственность накопления сока у сорго также далека от понимания. Хотя сухое может контролировать содержание сочности в сорго, сеть его регуляции пока неизвестна. Зерновое сорго с сочными стеблями обычно различается по конечному урожаю зерна, но неясно, связано ли это с сухим [45]. Кроме того, сохранение зеленого цвета было важным признаком в селекции сорго, а B35, SC56 и E36-1 обычно признаются сорго с поздним колошением (осталось зеленым) [46]. Хотя было идентифицировано множество зеленых генетических локусов, в том числе четыре основных «зеленых» QTL (Stg1, Stg2, Stg3 и Stg4), причинные гены еще не клонированы [47,48]. Совсем недавно Kiranmayee et al. (2020) идентифицировали семь QTL и несколько генов-кандидатов, контролирующих признак «оставайся зеленым» в популяции, картирующей FNE, что обеспечивает надежную экспериментальную и теоретическую основу для понимания механизма «оставания зеленым» [49]. В будущем необходимо провести углубленные исследования с точки зрения выявления фенотипических вариаций и генетических вариаций, а также характеристики новых аллелей важных генов, молекулярных модулей (ММ) и функциональных сетей, придающих важные агротехнические признаки. Кроме того, нацеливание на включение этих супераллелей специфических генов и функциональных ММ в превосходные линии потенциально может привести к созданию улучшенных сортов. Целью селекции сорго из биомассы является увеличение PH и DY при одновременном сокращении периода вегетативного роста. В этом исследовании основные аллели SNP, связанные с HD, PH и DY, обнаруженные в 96 генотипах сорго, были связаны с сокращением срока колошения, более низкой урожайностью в сухом виде и увеличением высоты растений (рис. 4). Когда мы сравнили аллели каждого признака с эталонным геномом сорго (Sorghum bicolor Rio_v2), мы обнаружили, что многие мутантные линии имеют альтернативные аллели, что указывает на то, что мутантная селекция может обеспечить разнообразие селекционных материалов. Сорго является перспективной культурой биомассы для производства полигидроксиалканоатов (ПГА) благодаря высокому выходу зеленой биомассы, засухоустойчивости, короткому периоду роста и способности адаптироваться к различным почвенным условиям и климату [50]. Кроме того, сорго представляет собой лигноцеллюлозную культуру, состоящую из лигнина и полисахаридов (целлюлозы и гемицеллюлозы), что делает его отличным сырьем для ферментируемого сахара [51]. Однако для эффективного использования лигноцеллюлозы необходима предварительная обработка, такая как гидролиз. Во время гидролиза и предварительной обработки фенольные соединения могут сильно ингибировать рост микробов и производство биопродуктов, что приводит к низкой эффективности преобразования биомассы [21]. Общее содержание фенолов (TPC) в стеблях сорго, включая листья, было определено с помощью UPLC в этом исследовании, чтобы понять их потенциальное негативное влияние на предварительную обработку и последующие процессы использования лигноцеллюлозы в качестве биомассы. Анализ UPLC показал, что Pahat-4 демонстрирует самую низкую ТФХ (1,92 мг/100 г), что указывает на то, что эта линия может служить потенциальным селекционным материалом для фитохимической биомассы сорго. Следовательно, TPC можно считать важным фитохимическим признаком в программах селекции биомассы сорго. Тем не менее, высокие уровни TPC в биомассе сорго не могут быть полезными в качестве материала для размножения. Исследование также показало, что основные аллели SNP, связанные с TPC и фенольными соединениями в 96 генотипах сорго, были связаны с повышенным содержанием TPC и фенольных соединений (рис. 8). Эти результаты могут помочь определить ключевые генетические ресурсы для селекции сорго из биомассы. Используя 109 образцов сорго, Kawahigashi et al. (2013) сообщили, что относительно положительная корреляция была обнаружена в PH и DY (r = 0,323, P <0,01), HD и PH (r = 0,358, P <0,01), а также SC и DY (r = 0,673, P <0,01). ) [4]. Наши исследования показали сильную корреляцию между PH и DY (r = 0,60, P < 0,001), HD и PH (r = 0,40, P < 0,001), а также SC и DY (r = 0,23, P <0,01). показано Kawahigashi et al. (2013) [4]. В результате корреляционного анализа между ТФХ и шестью фенольными соединениями ТФХ и лютеолинидин показали наибольшую корреляцию (r = 0,82, P < 0,001). Это исследование показало, что лютеолинидин в TPC был самым высоким - 26,8%. Это означает, что лютеолинидин активно участвует в TPC. Точно так же Петти и соавт. (2014) проанализировали 3-дезоксиантоцианидины в красном листе (RG), и обнаружили, что лютеолинидин (68%) был самым высоким [52]. Это исследование показало, что HD сорго имеет положительную корреляцию с PH и DY. Кроме того, было показано, что существует значимая корреляция между DY и PH, SC. В фитохимических веществах наблюдалась сильная корреляция между ТФХ и лютеолинидином. Наши результаты указывают на корреляцию между агрономическими признаками и фенольными соединениями, которая будет полезна для селекционных программ, направленных на увеличение производства биомассы сорго. Мы идентифицировали SNP в 96 генотипах сорго, используя данные GBS, получив примерно 719 миллионов прочтений со средним значением 246,7 SNP на Мб (от 196,8 на хромосоме 7 до 310,0 на хромосоме 1) (таблица 5). В предыдущем исследовании Li et al. (2018), SNP были идентифицированы в 245 образцах сорго с использованием GBS, что дало примерно на 36 миллионов прочтений меньше, чем в нашем исследовании [53]. В Ли и соавт. (2018), плотность SNP варьировала от 92,91 (хромосома 7) до 150,31 (хромосома 3) SNP на Мб (в среднем 124,04) [54]. Наше исследование показало примерно вдвое большее количество прочтений во всех хромосомах по сравнению с Li et al. (2018) результаты [53]. Это открытие будет полезно для выявления значимых SNP, связанных с агрономическими признаками и фитохимическими веществами, в анализе GWAS. В этом исследовании мы провели анализ GWAS для трех агрономических признаков (HD, PH и DY) и шести фенольных соединений (TPC, лютеолинидин диглюкозид, лютеолин глюкозид, апигенидин глюкозид, лютеолинидин и 5-O-Me лютеолинидин) с использованием четырех моделей ( BLINK, FarmCPU, MLMM и MLM). Было обнаружено, что в общей сложности 40 SNP на 10 хромосомах тесно связаны с тремя агрономическими признаками (9 SNP) и шестью фенольными соединениями (31 SNP) (таблицы 6 и 7). Мы идентифицировали четыре SNP-кандидата на HD на хромосомах 2, 6 и 10. Два SNP (Sb02_6876523, -log10(p) = 4,15 и Sb02_6876524; -log10(p) = 4,15), идентифицированные на хромосоме 2, кодируют ген-кандидат, SbRio.02G064100 (6 875 288–6 876 924), который действует как O- бензоилтрансфераза бензилового спирта (BEBT). Ген BEBT не описан у сорго, но он экспрессируется в различных тканях, включая листья, стебли и цветки, и его экспрессия может регулироваться на протяжении всего жизненного цикла растения [54]. Сообщалось также, что он играет важную роль в защите растений от травоядных. Связанный с HD SNP Sb06_8705823 [-log10(p) = 4,16] находился на хромосоме 6 и кодировал SbRio.06G036000 (8 702 846–8 706 870), который функционирует как эндо-1,4-бета-ксиланаза 4-подобная изоформа X2. Функция эндо-1,4-бета-ксиланазы 4-подобной изоформы заключается в гидролизе бета-1,4-связей между единицами ксилозы в ксилане с образованием более коротких ксилоолигосахаридов (XOS) и мономеров ксилозы в сорго [55]. Этот процесс важен для деградации клеточных стенок растений, но прямой связи между эндо-1,4-бета-ксиланазой и ее 4-подобной изоформой нет. SNP-маркер Sb10_7471984 был отобран для HD, а ген SbRio.10G099600 (7 471 439 – 7 474 862) был обнаружен как сильный ген- кандидат. Этот маркер показал самый высокий -log10(p) = 4,20-4,93 для HD (таблица 6); разница между мажорными и минорными аллелями БХ достигала 15 дней (рис. 4). В GWAS семей NAM Mace et al. (2013) обнаружили значительный QTL (QDTFL10.9; 7 404 486 – 7 843 453; -log10(p) = 3,09) для дней до цветения на хромосоме 10 [56]. Идентифицированные нами SNP принадлежали группе Mace et al. (2013) Область локусов QTL [56]. Кроме того, Sb10_7471984 был единственным SNP, связанным с агрономическими признаками, обнаруженным совместно в четырех моделях GWAS. Поэтому мы предполагаем, что Sb10_7471984 является значимым SNP, вовлеченным в HD. Мы идентифицировали три SNP, связанных с ЛГ [Sb07_53523852, - log10(p) = 4,12 – 4,18; Sb08_63291752, -log10(p) = 7,80 – 8,08; Sb09_50399847, -log10(p) = 5,77 – 11,70], которые находились в SbRio.07G123800 (53 519 727 – 53 524 825), SbRio.08G141500 (63 291 201 – 63 292 248) и SbRio.0 9G149200 (50 399 626 - 50 401 297) на хромосомах 7, 8 и 9 соответственно. Мадхусудхана и Патил (2013) идентифицировали связанный с PH QTL (QHGHT7.14; 50 987 537–56 527 686; LOD = 3,7) на хромосоме 7 с использованием популяции RIL ('296B' × 'IS18551'), и Sb07_53523852 был расположен в том же регионе. [43]. Sb08_63291752 и Sb09_50399847 кодируют гипотетические белки, функции которых неизвестны. Однако Sb09_50399847 находился в том же регионе, что и QTL (QDTFL9.14; 49 467 769 – 53 919 120; 510 LOD = 4,2) в Kong et al (2013), и этот QTL был связан со зрелостью [44]. Также этот маркер имел самый высокий -log10(p) = 5,77-11,70 для PH с разницей в 99 дней между мажорным и минорным аллелями (рис. 4). Таким образом, мы выбрали SNP-маркер Sb09_50399847 для ЛГ, а в качестве гена-кандидата был обнаружен SbRio.09G149200. В этом исследовании мы обнаружили два SNP для DY на хромосомах 4 и 6. Мы идентифицировали SNP-кандидат для DY (Sb04_2143594; -log10(p) = 4,40–6,82), который был расположен в SbRio.04G031300 (2 139 572–2 145 536) на хромосоме. 4. Ортис и др. (2017) обнаружили значимые SNP для холодоустойчивости 517 и фотосинтеза на хромосоме 4 (QPSII4.11; 2 006 688 – 2 158 867; p = 7,09E-05; QLFTE4.1; 2 116 548 – 2 268 727; p = 1,00E-04) в ассоциации сорго. панель, и наши SNP были расположены в этом регионе [57]. Мы обнаружили один новый SNP. Роман SNP [Sb06_62687750; -log10(p) = 4,20 – 6,08] был расположен в SbRio.06G211400 (62 686 769 – 62 688 489) на хромосоме 6, которая является областью, связанной с транскрипционным фактором MafB (v-maf мышечно- апоневротическая фибросаркома, онкоген гомолога B). MafB представляет собой фактор транскрипции Maf, кодирующий белок bZIP (основная букиновая застежка-молния). Белок bZIP регулирует различные специфические для растений явления, включая прорастание и созревание семян, фотоморфогенез, индукцию и развитие цветков [58,59]. Он также участвует в реакциях на биотический и абиотический стресс посредством пути передачи сигнала АБК [59]. Маркер SNP Sb06_62687750 для DY был выбран на основе функции гена, и SbRio.06G211400 был обнаружен в качестве гена- кандидата. Наши результаты GWAS, связанные с агрономическими признаками, показывают, что гены SbRio.10G099600 (HD), SbRio.09G149200 (PH) и SbRio.06G211400 (DY) могут использоваться в качестве важных молекулярных маркеров для программ селекции растений, направленных на улучшение признаков и получение материалов биомассы. GWAS-анализ признаков архитектуры растений, связанных с зерном и биомассой, в сорго выявил 101 SNP, связанный по крайней мере с одним из девяти признаков, а KS3, биосинтетический ген GA, расположенный в значимом генетическом локусе на хромосоме 6, был связан с количеством семян. [60]. Недавно крупномасштабный GWAS панели из 837 образцов сорго и популяции BC- NAM из 1421 особи выявил 81 QTL, связанный с размером зерна [61]. Поскольку агротехнические признаки зерновых культур имеют сходную физиологическую основу, дальнейшие сравнительные исследования различных зерновых культур могут облегчить изучение генетических основ урожайности зерна сорго. Анализ GWAS TPC и шести фенольных соединений выявил четыре SNP, связанных с двумя соединениями, и мы выбрали их в качестве SNP-кандидатов для фенольных соединений. Три SNP-кандидата (Sb02_81796960, Sb02_81797062 и Sb02_81797139) вносят вклад в TPC и лютеолинидин, и они являются новыми SNP, расположенными в областях, о которых ранее не сообщалось. Эти SNP совместно локализованы в SbRio.02G343600 (81 787 329–81 797 324) на хромосоме 2, которая кодирует ген рецептора этилена 4 (LeETR4). LeETR4 является этиленотрицательным регулятором и принадлежит к подсемейству II рецептора этилена [62]. Было обнаружено, что экспрессия LeETR4 обратно пропорциональна чувствительности к этилену, что указывает на то, что рецептор может регулировать реакцию на этилен [63,64]. Это позволяет предположить, что LeETR4 может играть роль в контроле синтеза фенилпропаноидных соединений, включая флавонолы, которые синтезируются такими генами, как CHS, CHI и FLS, поскольку известно, что эти гены индуцируются этиленом [65]. Тот факт, что эти три SNP вносят вклад как в TPC, так и в лютеолинидин, вероятно, связан с сильной положительной корреляцией, наблюдаемой между этими двумя соединениями (r = 0,82, P <0,001) (рис. 3). Кроме того, среди трех SNP Sb02_81797062 имел самое высокое значение -log10(p) 6,55–14,04 для TPC и 4,58 для лютеолинидина (таблица 7). Разница в ТФХ и лютеолинидине между мажорным и минорным аллелями этого SNP составила 5,82 и 1,38 мг/100 г соответственно. (Рисунок 5). Таким образом, считается, что три новых SNP- маркера, обнаруженных в этом исследовании, тесно связаны с TPC и лютеолинидином. Мы предполагаем, что маркеры SNP Sb02_81796960, Sb02_81797062 и Sb02_81797139 для TPC и лютеолинидина и ген SbRio.02G343600 были обнаружены как сильные гены-кандидаты. Кандидат SNP Sb04_56584914, который вносит вклад одновременно в TPC и лютеолинидин диглюкозид, был расположен в SbRio.04G259800 (56 584 076 – 56 588 610) на хромосоме 4, которая кодирует субъединицу альфа-1 компонента пируватдегидрогеназы Е1, митохондриальную (PDHA1). PDHA1 — это белок, который участвует в превращении пирувата в ацетил-КоА в пируватдегидрогеназном комплексе (PDC), что является критическим этапом клеточного дыхания, которое происходит в митохондриях эукариотических клеток [66]. Компонент E1 PDC отвечает за первую стадию превращения пирувата в ацетил-КоА, и его экспрессия и активность могут влиять на доступность ацетил-КоА, предшественника метаболитов флавоноидов, и, следовательно, влиять на выработку фенилпропаноидов в растениях [67]. ,68]. Маркер SNP Sb04_56584914 был идентифицирован как сильный ген-кандидат для TPC и диглюкозида лютеолинидина, и было обнаружено, что ген SbRio.04G259800 связан с этим маркером. При значении -log10(p), равном 4,06 для ТФХ и 4,40 для лютеолинидина (табл. 5), этот маркер имел наивысшую значимость для обоих соединений. Наши результаты показывают, что SbRio.02G343600 (LeETR) и SbRio.04G259800 являются многообещающими объектами для программ селекции растений, направленных на создание культур с улучшенными флавоноидными соединениями, которые могут найти применение в пищевой и кормовой промышленности или в производстве продуктов из биомассы. Эти результаты, вероятно, помогут в точной селекции агрономических и фитохимических признаков сорго. Чтобы лучше понять генетическую основу связанных с биоэнергетикой признаков сорго, Brenton et al. (2016) провели GWAS на 390 различных типах сорго, включая сорта сладкого и биомассы, и обнаружили, что накопление неволокнистых углеводов связано с ферментами целлюлозы и вакуолярным переносчиком [69]. Что касается показателей качества корма, Li et al. (2018) проанализировали содержание сырого белка, клетчатки с нейтральным детергентом, клетчатки с кислотным детергентом, гемицеллюлозы и целлюлозы в 245 линиях сорго, идентифицировав 42 SNP и 14 генов- кандидатов [53]. Кроме того, недавний GWAS 206 образцов кормового сорго идентифицировал девять QTL для содержания лигнина, которые охватывают |