Главная страница
Навигация по странице:

  • ИИ В НАУКАХ О ЖИЗНИ

  • Mutual inspiration between AI and neuroscience

  • Взаимное вдохновение между ИИ и нейронаукой

  • AI for omics big data analysis

  • ИИ для анализа больших данных омики

  • AI makes modern agriculture smart

  • ИИ делает современное сельское хозяйство умным

  • Перевод искусственный интеллект. Can machines think


    Скачать 250.78 Kb.
    НазваниеCan machines think
    АнкорПеревод искусственный интеллект
    Дата18.12.2022
    Размер250.78 Kb.
    Формат файлаdocx
    Имя файлаAI A powerful paradigm for scientific research.docx
    ТипДокументы
    #851343
    страница7 из 10
    1   2   3   4   5   6   7   8   9   10
    1   2   3   4   5   6   7   8   9   10

    AI IN THE LIFE SCIENCES

    The developments of AI and the life sciences are intertwined. The ultimate goal of AI is to achieve human-like intelligence, as the human brain is capable of multi-tasking, learning with minimal supervision, and generalizing learned skills, all accomplished with high efficiency and low energy cost.107

    ИИ В НАУКАХ О ЖИЗНИ

    Разработки ИИ и наук о жизни переплетаются. Конечной целью ИИ является достижение человекоподобного интеллекта, поскольку человеческий мозг способен к многозадачности, обучению с минимальным контролем и обобщению приобретенных навыков, все это достигается с высокой эффективностью и низкой стоимостью энергии.107

    Mutual inspiration between AI and neuroscience

    In the past decades, neuroscience concepts have been introduced into ML algorithms and played critical roles in triggering several important advances in AI. For example, the origins of DL methods lie directly in neuroscience,5 which further stimulated the emergence of the field of RL.108 The current state-of-the-art CNNs incorporate several hallmarks of neural computation, including nonlinear transduction, divisive normalization, and maximum-based pooling of inputs,109 which were directly inspired by the unique processing of visual input in the mammalian visual cortex.110 By introducing the brain’s attentional mechanisms, a novel network has been shown to produce enhanced accuracy and computational efficiency at difficult multi-object recognition tasks than conventional CNNs.111 Other neuroscience findings, including the mechanisms underlying working memory, episodic memory, and neural plasticity, have inspired the development of AI algorithms that address several challenges in deep networks.108 These algorithms can be directly implemented in the design and refinement of the brain-machine interface and neuroprostheses. On the other hand, insights from AI research have the potential to offer new perspectives on the basics of intelligence in the brains of humans and other species. Unlike traditional neuroscientists, AI researchers can formalize the concepts of neural mechanisms in a quantitative language to extract their necessity and sufficiency for intelligent behavior. An important illustration of such exchange is the development of the temporal-difference (TD) methods in RL models and the resemblance of TD-form learning in the brain. Therefore, the China Brain Project covers both basic research on cognition and translational research for brain disease and brain-inspired intelligence technology.

    Взаимное вдохновение между ИИ и нейронаукой

    В последние десятилетия концепции нейробиологии были введены в алгоритмы ML и сыграли решающую роль в запуске нескольких важных достижений в области ИИ. Например, истоки методов DL лежат непосредственно в нейробиологии,5 что еще больше стимулировало появление области RL.108 Современные CNN включают в себя несколько отличительных признаков нейронных вычислений, включая нелинейную трансдукцию, разделяющую нормализацию и максимальное объединение входных данных,109 которые были непосредственно вдохновлены уникальной обработкой визуального ввода в зрительной коре млекопитающих.110 Путем введения механизмов внимания мозга, было показано, что новая сеть обеспечивает повышенную точность и вычислительную эффективность при сложных задачах многообъектного распознавания, чем обычные CNN.111 Другие результаты нейробиологии, включая механизмы, лежащие в основе рабочей памяти, эпизодической памяти и нейронной пластичности, вдохновили на разработку алгоритмов ИИ, которые решают несколько проблем в глубоких сетях.108 Эти алгоритмы могут быть непосредственно реализованы при проектировании и уточнении интерфейса мозг-машина и нейропротезы. С другой стороны, идеи исследований ИИ могут предложить новые перспективы на основы интеллекта в мозге людей и других видов. В отличие от традиционных нейробиологов, исследователи ИИ могут формализовать концепции нейронных механизмов на количественном языке, чтобы извлечь их необходимость и достаточность для интеллектуального поведения. Важной иллюстрацией такого обмена является развитие методов временных различий (TD) в моделях RL и сходство обучения TD-формы в мозге. Таким образом, Китайский проект мозга охватывает как фундаментальные исследования по познания, так и трансляционные исследования заболеваний мозга и интеллектуальные технологии, вдохновленные мозгом.

    AI for omics big data analysis

    Currently, AI can perform better than humans in some well-defined tasks, such as omics data analysis and smart agriculture. In the big data era,114 there are many types of data (variety), the volume of data is big, and the generation of data (velocity) is fast. The high variety, big volume, and fast velocity of data makes having it a matter of big value, but also makes it difficult to analyze the data. Unlike traditional statistics-based methods, AI can easily handle big data and reveal hidden associations. In genetics studies, there are many successful applications of AI.115 One of the key questions is to determine whether a single amino acid polymorphism is deleterious.116 There have been sequence conservation-based SIFT117 and network-based SySAP,118 but all these methods have met bottlenecks and cannot be further improved. Sundaram et al. developed PrimateAI, which can predict the clinical outcome of mutation based on DNN. Another problem is how to call copy-number variations, which play important roles in various cancers.120,121 Glessner et al. proposed a DL-based tool DeepCNV, in which the area under the receiver operating characteristic (ROC) curve was 0.909, much higher than other ML methods.122 In epigenetic studies, m6A modification is one of the most important mechanisms.123 Zhang et al. developed an ensemble DL predictor (EDLm6APred) for mRNA m6A site prediction.124 The area under the ROC curve of EDLm6APred was 86.6%, higher than existing m6A methylation site prediction models. There are many other DL-based omics tools, such as DeepCpG125 for methylation, DeepPep126 for proteomics, AtacWorks127 for assay for transposaseaccessible chromatin with high-throughput sequencing, and deepTCR128 for T cell receptor sequencing. Another emerging application is DL for single-cell sequencing data. Unlike bulk data, in which the sample size is usually much smaller than the number of features, the sample size of cells in single-cell data could also be big compared with the number of genes. That makes the DL algorithm applicable for most single-cell data. Since the single-cell data are sparse and have many unmeasured missing values, DeepImpute can accurately impute these missing values in the big gene 3 cell matrix.129 During the quality control of single-cell data, it is important to remove the doublet solo embedded cells, using autoencoder, and then build a feedforward neural network to identify the doublet.130 Potential energy underlying single-cell gradients used generative modeling to learn the underlying differentiation landscape from time series single-cell RNA sequencing data.131 In protein structure prediction, the DL-based AIphaFold2 can accurately predict the 3D structures of 98.5% of human proteins, and will predict the structures of 130 million proteins of other organisms in the next few months.132 It is even considered to be the second-largest breakthrough in life sciences after the human genome project133 and will facilitate drug development among other things.

    ИИ для анализа больших данных омики

    В настоящее время ИИ может работать лучше, чем люди, в некоторых четко определенных задачах, таких как анализ данных омики и умное сельское хозяйство. В эпоху больших данных114 существует много типов данных (разнообразие), объем данных велик, а генерация данных (скорость) происходит быстро. Большое разнообразие, большой объем и высокая скорость передачи данных делают их очень ценными, но также затрудняют анализ данных. В отличие от традиционных методов, основанных на статистике, ИИ может легко обрабатывать большие данные и выявлять скрытые ассоциации. В генетических исследованиях существует много успешных применений AI.115 Одним из ключевых вопросов является определение того, является ли полиморфизм одной аминокислоты вредным.116 Существовали SIFT117 на основе сохранения последовательностей и сетевые SySAP,118, но все эти методы встретили узкие места и не могут быть дополнительно улучшены. Sundaram et al. разработали PrimateAI, который может предсказать клинический исход мутации на основе DNN. Другая проблема заключается в том, как вызвать вариации числа копий, которые играют важную роль в различных раковых заболеваниях.120 121 Глесснер и др. предложили инструмент на основе DL DeepCNV, в котором площадь под кривой рабочих характеристик приемника (ROC) составляла 0,909, что намного выше, чем у других методов ML.122 В эпигенетических исследованиях модификация m6A является одним из наиболее важных механизмов.123 Zhang et al. разработали ансамблевый предиктор DL (EDLm6APred) для прогнозирования сайта m6A мРНК.124 Область под кривой ROC является одним из наиболее важных механизмов.123 Zhang et al. разработали ансамблевый предиктор DL (EDLm6APred) для прогнозирования сайта mRNA m6A.124 Область под кривой ROC является одним из наиболее важных механизмов.123 Zhang et al. разработали ансамблевый предиктор DL (EDLm6APred) для прогнозирования сайта mRNA m6A.124 Область под кривой ROC является одним из наиболее важных механизмов.123 Zhang et al. разработали ансамблевый предиктор DL (EDLm6APred) для прогнозирования сайта mRNA m6A.124 Область под кривой ROC EDLm6APred составил 86,6%, что выше, чем существующие модели прогнозирования участков метилирования m6A. Существует много других инструментов омики на основе DL, таких как DeepCpG125 для метилирования, DeepPep126 для протеомики, AtacWorks127 для анализа транспозазадоступного хроматина с высокопроизводительным секвенированием и deepTCR128 для секвенирования рецепторов Т-клеток. Другим новым приложением является DL для данных секвенирования одной ячейки. В отличие от объемных данных, в которых размер выборки обычно намного меньше, чем количество признаков, размер выборки клеток в одноклеточных данных также может быть большим по сравнению с количеством генов. Это делает алгоритм DL применимым для большинства одноячечных данных. Поскольку одноклеточные данные разрежены и имеют много неизмеренных отсутствующих значений, DeepImpute может точно вменить эти недостающие значения в матрицу больших клеток гена 3.129 Во время контроля качества одноклеточных данных важно удалить дублетные одиночные встроенные клетки, используя автоэнкодер, а затем построить нейронную сеть для идентификации дублета.130 Потенциальная энергия, лежащая в основе одноклеточных градиентов, использовала генеративное моделирование для изучения базового ландшафта дифференцировки со временем Серия данных секвенирования одноклеточной РНК.131 В прогнозировании структуры белка AIphaFold2 на основе DL может точно предсказать 3D-структуры 98,5% белков человека и будет предсказывать структуры 130 миллионов белков других организмов в ближайшие несколько месяцев.132 Он даже считается вторым по величине прорывом в науках о жизни после проекта генома человека133 и будет способствовать разработке лекарств среди прочего.

    AI makes modern agriculture smart

    Agriculture is entering a fourth revolution, termed agriculture 4.0 or smart agriculture, benefiting from the arrival of the big data era as well as the rapid progress of lots of advanced technologies, in particular ML, modern information, and communication technologies.134,135 Applications of DL, information, and sensing technologies in agriculture cover the whole stages of agricultural production, including breeding, cultivation, and harvesting. Traditional breeding usually exploits genetic variations by searching natural variation or artificial mutagenesis. However, it is hard for either method to expose the whole mutation spectrum. Using DL models trained on the existing variants, predictions can be made on multiple unidentified gene loci.136 For example, an ML method, multi-criteria rice reproductive gene predictor, was developed and applied to predict coding and lincRNA genes associated with reproductive

    processes in rice.137 Moreover, models trained in species with well-studied genomic data (such as Arabidopsis and rice) can also be applied to other species with limited genome information (such as wild strawberry and soybean).138 In most cases, the links between genotypes and phenotypes are more complicated than we expected. One gene can usually respond to multiple phenotypes, and one trait is generally the product of the synergism between multi-genes and multi-development. For this reason, multi-traits DL models were developed and enabled genomic editing in plant breeding.139,140 It is well known that dynamic and accurate monitoring of crops during the whole growth period is vitally important to precision agriculture. In the new stage of agriculture, both remote sensing and DL play indispensable roles. Specifically, remote sensing (including proximal sensing) could produce agricultural big data from ground, air-borne, to space-borne platforms, which have a unique potential to offer an economical approach for non-destructive, timely, objective, synoptic, long-term, and multi-scale information for crop monitoring and management, thereby greatly assisting in precision decisions regarding irrigation, nutrients, disease, pests, and yield.141,142 DL makes it possible to simply, efficiently, and accurately discover knowledge from massive and complicated data, especially for remote sensing big data that are characterized with multiple spatial-temporal-spectral

    information, owing to its strong capability for feature representation and superiority in capturing the essential relation between observation data and agronomy parameters or crop traits.135,143 Integration of DL and big data for agriculture has demonstrated the most disruptive force, as big as the green revolution. As shown in Figure 7, for possible application a scenario of smart agriculture, multi-source satellite remote sensing data with various geo- and radio-metric information, as well as abundance of spectral information from UV, visible, and shortwave infrared to microwave regions, can be collected. In addition, advanced aircraft systems, such as unmanned aerial vehicles with multi/hyper-spectral cameras on board, and smartphonebased portable devices, will be used to obtain multi/hyper-spectral data in specific fields. All types of data can be integrated by DL-based fusion techniques for different purposes, and then shared for all users for cloud computing. On the cloud computing platform, different agriculture remote sensing models developed by a combination of data-driven ML methods and physical models, will be deployed and applied to acquire a range of biophysical and biochemical parameters of crops, which will be further analyzed by a decision-making and prediction system to obtain the current water/nutrient stress, growth status, and to predict future development. As a result, an automatic or interactive user service platform can be accessible to make the correct decisions for appropriate actions through an integrated irrigation and fertilization system. Furthermore, DL presents unique advantages in specific agricultural applications, such as for dense scenes, that increase the difficulty of artificial planting and harvesting. It is reported that CNNs and Autoencoder models, trained with image data, are being used increasingly for phenotyping and yield estimation,144 such as counting fruits in orchards, grain recognition and classification, disease diagnosis, etc.145–147 Consequently, this may greatly liberate the labor force.

    The application of DL in agriculture is just beginning. There are still many problems and challenges for the future development of DL technology. We believe, with the continuous acquisition of massive data and the optimization of algorithms, DL will have a better prospect in agricultural production.

    ИИ делает современное сельское хозяйство умным

    Сельское хозяйство вступает в четвертую революцию, называемую сельским хозяйством 4.0 или умным сельским хозяйством, извлекая выгоду из наступления эры больших данных, а также быстрого прогресса многих передовых технологий, в частности ML, современных информационных и коммуникационных технологий.134 135 Применение DL, информационных и сенсорных технологий в сельском хозяйстве охватывает все этапы сельскохозяйственного производства. включая разведение, выращивание и сбор урожая. Традиционная селекция обычно использует генетические вариации путем поиска естественных вариаций или искусственного мутагенеза. Тем не менее, любому методу трудно раскрыть весь спектр мутаций. Используя модели DL, обученные на существующих вариантах, прогнозы могут быть сделаны на нескольких неидентифицированных локусах генов.136 Например, был разработан и применен метод ML, многокритериальный предиктор репродуктивного гена риса, для прогнозирования кодирования и генов lincRNA, связанных с репродуктивными

    процессы в рисе.137 Кроме того, модели, обученные у видов с хорошо изученными геномными данными (таких как Arabidopsis и рис), также могут быть применены к другим видам с ограниченной информацией о геноме (таким как дикая клубника и соя).138 В большинстве случаев связи между генотипами и фенотипами более сложны, чем мы ожидали. Один ген обычно может реагировать на несколько фенотипов, а один признак, как правило, является продуктом синергизма между мультигенами и мульти-развитием. По этой причине были разработаны многохарактерные модели DL, которые позволили геномное редактирование в селекции растений.139 140 Хорошо известно, что динамический и точный мониторинг сельскохозяйственных культур в течение всего периода роста жизненно важен для точного земледелия. На новом этапе сельского хозяйства незаменимую роль играют как дистанционное зондирование, так и DL. В частности, дистанционное зондирование (включая зондирование в непосредственной близости) может производить сельскохозяйственные большие данные с земли, воздуха на космические платформы, которые обладают уникальным потенциалом для обеспечения экономичного подхода к неразрушающему, своевременному, объективному, синоптическому, долгосрочному и многомасштабному анализу для мониторинга и управления сельскохозяйственными культурами, тем самым в значительной степени помогая в принятии точных решений в отношении орошения, питательных веществ, болезней, вредителей и урожайности.141 142 DL позволяет просто, эффективно и точно находить знания из массивных и сложных данных, особенно для больших данных дистанционного зондирования, которые характеризуются множественными пространственно-временными спектральными

    информации, благодаря ее сильной способности представлять признаки и превосходству в улавливании существенной связи между данными наблюдений и агрономическими параметрами или признаками сельскохозяйственных культур.135 143 Интеграция DL и больших данных для сельского хозяйства продемонстрировала самую разрушительную силу, такую же большую, как зеленая революция. Как показано на рисунке 7, для возможного применения сценария умного сельского хозяйства могут быть собраны данные дистанционного зондирования с несколькими источниками спутникового дистанционного зондирования с различной гео- и радиометрической информацией, а также обилие спектральной информации от УФ, видимого и коротковолнового инфракрасного до микроволнового регионов. Кроме того, передовые авиационные системы, такие как беспилотные летательные аппараты с мульти/гиперспектральными камерами на борту и портативные устройства на базе смартфонов, будут использоваться для получения мульти/гиперспектральных данных в конкретных областях. Все типы данных могут быть интегрированы с помощью методов слияния на основе DL для различных целей, а затем совместно использоваться для всех пользователей для облачных вычислений. На платформе облачных вычислений различные модели дистанционного зондирования сельского хозяйства, разработанные комбинацией методов машинного обучения на основе данных и физических моделей, будут развернуты и применены для получения ряда биофизических и биохимических параметров сельскохозяйственных культур, которые будут дополнительно проанализированы системой принятия решений и прогнозирования для получения текущего водного / питательного стресса, состояния роста, и прогнозирование будущего развития. В результате может быть доступна автоматическая или интерактивная платформа обслуживания пользователей для принятия правильных решений о соответствующих действиях через интегрированную систему орошения и удобрения. Кроме того, DL представляет уникальные преимущества в конкретных сельскохозяйственных приложениях, таких как для плотных сцен, которые увеличивают сложность искусственной посадки и сбора урожая. Сообщается, что модели CNN и Autoencoder, обученные с помощью данных изображений, все чаще используются для фенотипирования и оценки урожайности144, таких как подсчет фруктов в садах, распознавание и классификация зерна, диагностика заболеваний и т. Д. 145–147 Следовательно, это может значительно освободить рабочую силу.

    Применение DL в сельском хозяйстве только начинается. Есть еще много проблем и вызовов для будущего развития технологии DL. Мы считаем, что с непрерывным получением массивных данных и оптимизацией алгоритмов DL будет иметь лучшие перспективы в сельскохозяйственном производстве.


    написать администратору сайта