Главная страница

Пер. перевод олимпиада 2020-01. Ученые и лица, принимающие решения, полагаются на климатические модели для предсказаний будущего изменения климата


Скачать 70.31 Kb.
НазваниеУченые и лица, принимающие решения, полагаются на климатические модели для предсказаний будущего изменения климата
Дата23.03.2022
Размер70.31 Kb.
Формат файлаdocx
Имя файлаперевод олимпиада 2020-01.docx
ТипДокументы
#411848





Аннотация: Ученые и лица, принимающие решения, полагаются на климатические модели для предсказаний будущего изменения климата. Традиционно физические процессы, играющие ключевую роль в прогнозировании экстремальных явлений, представляются либо непосредственно (разрешенными), либо косвенно (параметризованными).

Я анализирую эпистемологические последствия этого метода и утверждаю, что он подрывает надежность модельных предсказаний. Я приписываю широко распространенную неудачу в обобщаемости нейронных сетей отсутствию представления процесса. Представление климатических процессов значительно повышает надежность прогнозов климатических моделей.
  1. Введение


Успех методов машинного обучения в содействии научным открытиям в таких дисциплинах, как биология (например, биоинформатика), побудил некоторых объявить науку, интенсивно работающую с данными, четвертой парадигмой науки, фундаментальной трансформацией научного метода (Gray 2007). Зарождающаяся область климатической информатики была основана на оптимизме в отношении того, что методы машинного обучения будут иметь столь же глубокие последствия в науке о климате (Monteleoni et al. 2013).

Появляется все больше литературы, в которой исследуется потенциал использования методов машинного обучения (МО) в сочетании с моделями общей циркуляции (МОЦ), чтобы превзойти и, возможно, заменить традиционные модели за счет улучшения прогнозов1 (Dueben & Bauer, 2018 г.), обеспечивая понимание ключевых климатических процессов (Ganguly и др., 2014 г.), облегчая выявление причинно-следственных связей (Упхофф и Денг, 2015 г.) и снижая погрешности и неопределенности в моделировании МОЦ (Штайнхойзер и др., 2010 г.; Расп и др., 2018 г.). Некоторые ставят под сомнение возможность замены физических моделей моделями, управляемыми данными: «Могут ли модели прогнозирования, основанные на глубоком обучении и обучении на атмосферных данных, конкурировать или даже превосходить модели погоды и климата, основанные на физических знаниях и основные на уравнении движения?» (Дуэбен и Бауэр, 2018, 4000).

Могут ли методы машинного обучения заменить прогнозирование погоды и климатические модели, остается открытым вопросом. Я сосредоточу свое внимание на последующем вопросе: что повлечет за собой такой сдвиг в методологии науки о климате для надежности проекций климатических моделей? Я исследую такие последствия, исследуя все более распространенную практику замены традиционных параметризаций моделей параметризациями машинного обучения в климатических моделях. В то время как традиционные параметризации косвенно представляют климатические процессы, параметризация МО направлена ​​на обеспечение того же навыка прогнозирования без прямого или косвенного представления климатических процессов. Я утверждаю, что появление методов машинного обучения, таких как параметризация нейронных сетей, коренным образом меняет разработку и оценку моделей климата. Я подкрепляю свой аргумент примером того, как искусственные нейронные сети используются для замены конвективной параметризации в климатических моделях. Климатические модели с параметризацией ML не могут быть прогностически точными за пределами обучающих данных. Я приписываю эту неудачу отсутствию представления процесса. Представление климатических процессов значительно повышает надежность прогнозов климатических моделей.
  1. Конвективная параметризация




    1. Конвективные процессы


Конвекция — это перенос тепла и влаги за счет потока, создаваемого подъемом горячего воздуха и опусканием холодного воздуха. Конвекция является ключевым процессом в формировании облаков, которые (1) вызывают экстремальные осадки, торнадо и т. д. и (2) определяют величину атмосферного потепления в ответ на повышение концентрации парниковых газов. Ученые и лица, принимающие решения, полагаются на климатические модели для прогнозирования будущего изменения климата, особенно экстремальных явлений, таких как засухи, торнадо и муссоны. Однако многие физические процессы, играющие ключевую роль в точном прогнозировании экстремальных явлений, плохо изучены и происходят в масштабах, намного меньших, чем моделируемые.

Но моделирование с разрешением, позволяющим конвекцию, в глобальном масштабе требует больших вычислительных ресурсов. В результате такие процессы упрощаются и аппроксимируются в косвенных представлениях, называемых параметризациями.

    1. Традиционная параметризация

Параметризация — это метод косвенного представления таких процессов с помощью упрощенных математических выражений. Эти выражения описывают влияние процесса на остальную часть модели как функцию переменных, которые непосредственно представлены в модели. Параметризация принимает состояние поля сетки в качестве входных данных и рассчитывает, как крупномасштабные переменные изменяются с течением времени. Необходимым условием для параметризации является допущение о замыкании или предполагаемое существование физической взаимосвязи между разрешаемой крупномасштабной переменной и процессами подсетки. Эта взаимосвязь облегчает идентификацию соответствующих крупномасштабных переменных, с помощью которых ученые могут косвенно представлять процессы подсетки. Предположения о закрытии могут быть независимо и эмпирически ограничены наблюдательными исследованиями. Например, общее предположение о закрытии состоит в том, что кучевая конвекция возникает только в том случае, если окружающая среда условно нестабильна (Беттс и Миллер, 1984). Однако наблюдательные исследования, такие как Thompson et al. (1979) продемонстрировали, что неустойчивость обратно пропорциональна конвективной активности. Таким образом, наблюдательные исследования поставили под сомнение обоснованность этого предположения и снизили доверие к прогнозам моделей, которые включали это предположение.

Это один из примеров того, как традиционные параметризации включают физические и эмпирические знания для эффективного ограничения проекций модели.

    1. Параметрическая неопределенность

Тем не менее, косвенное представление климатических процессов в традиционной параметризации не дает достаточно сильного ограничения на модельные прогнозы. То параметризация процессов, связанных с облачностью, особенно конвекции, является основной причиной разногласий между моделями и источником наибольшей неопределенности для модельных прогнозов изменения климата (Bony et al. 2015). Это связано с параметрической неопределенностью относительно наилучшего значения параметра для модели.

Важным различием между различными схемами параметризации климатического процесса является оценка значений параметров, связанных с крупномасштабными переменными, используемыми для косвенного представления подсеточных процессов. Значения таких параметров плохо ограничены основными принципами или данными наблюдений. Обычной практикой является настройка климатической модели, при которой ученый оценивает или вносит специальные изменения в значения неопределенных параметров для улучшения статистического соответствия между результатами модели и данными наблюдений. Учитывая большой набор параметров, необходимых для запуска и запуска сложной модели, такой как GCM, эта параметрическая неопределенность усугубляется. Это важно, учитывая, что параметрическая неопределенность в отношении идеальных значений параметров приводит к неопределенности в отношении прогнозов и поведения модели.

Научные методы, такие как настройка, могут ограничить ценность использования оценок соответствия модели для повышения уверенности в прогнозах модели. Оценка соответствия модели, оценивающая статистическое соответствие результатов модели данным наблюдений, является плохим показателем способности модели адекватно представлять ключевые процессы и прогнозировать наблюдаемые значения переменных, связанных с этими процессами, поскольку модель была намеренно настроена для достижения соответствия данные наблюдения. Обширная настройка параметров модели для соответствия прошлым данным подрывает способность модели делать надежные прогнозы о будущем климате, который отличается от прошлого и настоящего климата, на который были настроены параметры модели.

Традиционные методы параметризации сталкиваются с проблемами из-за параметрической неопределенности и широко распространенных методов, таких как настройка параметров. Обе проблемы коренятся в косвенном представление ключевых процессов, которое обеспечивает более слабое, чем необходимо, ограничение на проекции модели. Эти ограничения приводят к разработке моделей разрешения облачных вычислений (CRM).


  1. Облачные модели разрешения (CRM)


CRM — это модель с высоким разрешением, которая непосредственно представляет процессы подсетки, такие как глубокие конвективные облака. В результате CRM приводят к значительному улучшению прогнозов модели и снижению неопределенности модели (Prein et al. 2015, 340).

    1. Пример: Зелинка и др. (2017)


В следующем примере показано, как модели процессов с высоким разрешением способствовали расширению научного понимания и снижению неопределенности. В Третьем оценочном отчете (ТДО) Межправительственной группы экспертов ООН по изменению климата (МГЭИК) Stocker et al. заявляют, что точное и надежное моделирование изменения климата зависит от адекватного представления климатическими моделями климатических процессов, особенно процессов обратной связи (Stocker et al. 2001, 49-51). Процессы обратной связи с облаками являются источником «наибольшей неопределенности в будущих прогнозах климата», поскольку «знак чистой обратной связи облака все еще является вопросом неопределенности» (Stocker et al. 2001, 49), при этом некоторые модели дают положительную чистую обратную связь, а другие - отрицательную чистую обратную связь. Однако в Пятом оценочном отчете МГЭИК ученые смогли с уверенностью (вероятность 90%, «весьма вероятно») заявить, что «признак чистой радиационной обратной связи из-за всех типов облаков… вероятно положительный» (Zelinka et al. 2017), 636) со всеми глобальными климатическими моделями, имитирующими положительную чистую обратную связь с облачностью.

Зелинка и др. (2017) связывают улучшение модельных оценок обратной связи с облаками в пяти отчетах об оценке МГЭИК «моделям процессов с высоким разрешением», которые «осветили

конкурирующие процессы, которые управляют изменениями в низкой облачности и плотности» (Zelinka et al. 2017, 677). Это связано с тем, что модели процессов непосредственно представляют процессы в нижних слоях облачности, такие как микрофизика и фазы облаков, которые, как было обнаружено, вызывают положительные обратные связи, тем самым улучшая модельные оценки чистой радиационной обратной связи. Прямое представление таких процессов вводит дополнительные физические и эмпирические ограничения, которые улучшают прогностические характеристики климатических моделей.

Однако, несмотря на то, что CRM имеет существенные преимущества по сравнению с традиционными параметризациями, он требует слишком больших вычислительных ресурсов, чтобы работать в глобальном масштабе для прогнозирования климата. Таким образом, ученые разрабатывают параметризацию нейронной сети, пытаясь использовать прогностические преимущества CRM без прямого представления облаков и конвективных процессов.
  1. Параметризация нейронной сети (NNP)




    1. Искусственные нейронные сети (ИНС)

Нейронные сети успешно используются в широком спектре приложений, таких как распознавание изображений, беспилотные автомобили и т. д. Учитывая большой объем данных, нейронные сети обучаются описывать эволюцию нелинейных процессов. Многие климатические процессы являются нелинейными, и различные компоненты климатической системы взаимодействуют нелинейным образом. Из-за огромной сложности климатической системы и технических ограничений вычислительной мощности необходимо аппроксимировать нелинейные функции, описывающие климатические процессы. Искусственные нейронные сети обладают свойством универсальной функции аппроксимации, которая позволяет ИНС аппроксимировать любую нелинейную детерминированную функцию. Это свойство выполняется независимо от

характер приложения (климатическая система Земли) или ограниченное знание лежащих в основе процессов (процессы, связанные с облаками), которые могут создать проблему для разработки четкого физически обоснованного алгоритма (Schmidhuber 2015). Таким образом, ИНС являются перспективным методом, с помощью которого ученые могут лучше учитывать процессы, связанные с облаками, такие как конвекция, которые не могут быть адекватно представлены физическими уравнениями в GCM.

    1. Параметризация нейронной сети


Ученые обучают искусственную нейронную сеть изучать улучшенное представление конвективных облаков из CRM. Это включает в себя подгонку статистической модели к выходным данным CRM. Прогнозы ML-модели затем неоднократно сравниваются с прогнозами CRM с целью минимизации ошибки между выходными данными ML-модели и выходными данными CRM. Таким образом, ML-модель изучает сопоставление между входными и выходными переменными из CRM без явного программирования. Затем обученная нейронная сеть заменяет традиционную параметризацию в GCM (теперь это гибридный GCM) и взаимодействует с другими частями модели.

Ученые-климатологи проверяют три вещи при тестировании NNP: может ли гибридный GCM с NNP точно моделировать (1) основные статистические данные о климате, (2) закономерности изменчивости климата и экстремальных явлений и (3) изменение климата. Возможность моделирования изменения климата является проверкой обобщаемости NNP за пределами обучающих данных. Демонстрирует ли гибридная ГКМ соответствие модели климатической статистике и изменчивости, потому что NNP запомнил данные CRM или потому, что он изучил некоторые основные физические отношения, лежащие в основе выходных данных CRM и вызывающие изменение климата из CRM? Это важно, поскольку одной из целей разработки параметризации машинного обучения является получение информации о физических процессах на основе больших наборов климатических данных (Монтелеони, 2013 г.; Гангули, 2014 г.).

    1. Пример: Расп и др. (2018)


Расп и др. (2018) обучают 9-уровневую глубокую нейронную сеть для изучения процессов атмосферной подсетки на основе многомасштабной модели, которая явно разрешает конвекцию. Они используют Community Atmosphere Model v3.0 (SPCAM) в качестве модели облачного разрешения. Эта CRM явно представляет глубокие конвективные облака и использует параметризацию мелкомасштабной турбулентности и микрофизики облаков. CRM встроен в каждый столбец сетки GCM. Встроенная CRM выводит прогнозы тенденций субсеток климатических переменных, таких как влажность, в зависимости от состояния атмосферы в каждом столбце сетки и для каждого временного шага. Нейронная сеть обучается на выходных данных CRM за год для этих переменных и генерирует свои собственные прогнозы выходных переменных. Он проверяется, может ли он учиться на явно представленной конвекции в SPCAM.

Расп и др. затем замените традиционную параметризацию в GCM обученной нейронной сетью. Версия CAM для нейронной сети называется моделью атмосферы сообщества нейронной сети (NNCAM), и они проводят моделирование на 5 и 50 лет. Ключевой тест для Rasp et al. заключается в том, может ли нейронная сеть учиться на SPCAM, чтобы избежать недостатков, характерных для традиционных параметризаций, таких как двойная ITCZ ​​(смещение осадков). Затем они запускают стабильное многолетнее прогностическое моделирование с использованием гибридного GCM с обученной нейронной сетью.
  1. Чему машины не могут научиться




    1. Неспособность к обобщению


Когда ученые говорят о моделях машинного обучения, конкурирующих или превосходящих физические модели климата, они обычно имеют в виду прогностическую эффективность. Широко признано, что модели машинного обучения, в частности нейронные сети, хорошо предсказуемы и очень хорошо обобщают, но за счет того, что они являются «черными ящиками» или непрозрачны для научного понимания и физической интерпретации (McGovern 2019).

Обобщаемость — это вопрос о том, насколько хорошо модель машинного обучения обучается, проверяя свои навыки прогнозирования в новых ситуациях. Что касается исследования Распа и др., может ли NNCAM точно

смоделировать климат и изучить последствия беспрецедентных уровней воздействия, таких как высокая температура поверхности моря 4K, которых нет в обучающих данных? Могут ли нейронные сети изучить последствия чрезвычайно высоких уровней CO2 или предсказать поведение климатической системы в областях, не включенных в набор обучающих данных?

К сожалению, параметризация машинного обучения не может обобщать. Несмотря на заявления Распа и др. о том, что «способность NNCAM представляет большое преимущество по сравнению с традиционными параметризациями» (Rasp et al. 2018, 9687), NNCAM не может обобщить данные за пределами набора обучающих данных. Неудача в обобщаемости наносит серьезный удар по полезности параметризации нейронной сети в МОЦ для предсказания климатической модели.

    1. Отказ NNCAM и не только


Несмотря на первоначально положительные результаты, гибридный GCM (NNCAM) плохо обобщает температуры вне выборки. NNCAM подвергается трем тестам на чувствительность с возмущенными температурами поверхности моря (SST) для оценки возможности обобщения параметризации за пределами диапазона обучающих данных. NNCAM может стабильно работать с возмущениями ТПМ до 3 Кельвинов. Однако, когда возмущения имеют амплитуду 4 Кельвина, NNCAM не может обобщать: «сигнал ITCZ ​​размывается, и в пограничном слое и над ним развиваются нереалистичные паттерны… В результате температурная погрешность значительна, особенно в стратосфере. (Расп и др. 2018, 968).



Рисунок 1.Сводка исследований, изучающих конвективные параметризации ML и их обобщаемость.

Постоянная неспособность обобщать проблематична на двух фронтах. Во-первых, целью внедрения методов машинного обучения в моделировании климата было использование преимуществ CRM для прогнозирования глобального климата. Неадекватное умение предсказывать является неспособностью выполнить эту основную цель. Во-вторых, часто предполагается, что нейронные сети хорошо предсказывают, но не объясняют. Большое внимание было уделено раскрытию «черного ящика» нейронных сетей и проблемам, которые нейронные сети создают для понимания и объяснения (McGovern et al. 2019). Однако, как ни удивительно, предсказание также является проблемой для нейронных сетей в приложениях климатологии. В следующем разделе я предложу объяснение, которое связывает отсутствие представления процесса в параметризациях нейронных сетей с их неадекватностью прогнозирования.
  1. Что пошло не так? Объяснение



Параметризации машинного обучения не могут быть обобщены, потому что, как Rasp et al. обратите внимание, они превосходят выходные данные CRM. В процессе обучения нейросети на выходе CRM данных, нейронная сеть запоминает и воспроизводит сопоставление между входными и выходными переменными этого конкретного набора данных CRM вместо того, чтобы изучать общие физические или причинно-следственные отношения, лежащие в основе выходных данных CRM. Таким образом, нейронная сеть не может точно прогнозировать вне обучающего набора данных, хотя она очень хорошо соответствует данным CRM — на самом деле слишком хорошо.

Как правило, есть два способа улучшить способность модели прогнозировать вне выборки: улучшение и оценка представлений процессов. Обе стратегии налагают физические и эмпирические ограничения, которые более устойчивы к переоснащению, чем оценка соответствия модели. Это важно, потому что NNP особенно уязвимы для переобучения из-за обучения NNP на ранее настроенных CRM. Однако параметризация машинного обучения, такая как NNP, не представляет процессы прямо или косвенно, что исключает обе стратегии улучшения прогнозов модели, оставляя ученым оценку соответствия модели в качестве основной формы оценки модели. Это создает неприятную дилемму.



    1. От настройки к тренировке и обратно


Первоначальная озабоченность по поводу использования оценки соответствия модели для поддержки адекватности модели цели заключалась в том, что эффективность модели может быть обусловлена ​​специальной настройкой, а не точным представлением модели или предсказанием климатических процессов. Эта проблема усугубляется моделями нейронных сетей, которые обучаются на CRM, параметры которых были индивидуально настроены на данные наблюдений и которые могут по-прежнему включать параметризованные компоненты.

Например, CRM в Rasp et al. исследование — SPCAM — по-прежнему параметризует микрофизику облаков и мелкомасштабную турбулентность. CRM включает в себя процессы, которые представлены непосредственно, и другие, которые параметризованы, потому что они недостаточно понятны. Значения этих параметров оцениваются для максимального статистического соответствия выходных данных CRM данным наблюдений. Затем искусственная нейронная сеть обучается на выходных данных предварительно настроенной CRM. Прогнозы NNP затем неоднократно сравниваются с выходными данными CRM с целью минимизации ошибки между прогнозами NNP и выходными данными CRM.

Рисунок 2.


  1. Это ключевой параметр в CRM. Ученые могут настроить параметр или оценить значение P, чтобы максимизировать статистическое соответствие между данными наблюдений и выходными данными CRM.

  2. Нейронная сетьобучается на выходных данных CRM, которые рассчитываются по CRM в целом, включая P.

  3. Прогнозы NNP неоднократно сравниваются с выходными данными CRM с целью минимизации статистического расстояния между прогнозами CRM и NNP.


Это означает, что прогнозы нейронной сети могут соответствовать прогнозам CRM по ряду причин:
(1) Шанс (2) Адекватность (3) Настройка/Переоснащение (4) Некоторая комбинация вышеперечисленного.
Обучение параметризации машинного обучения на ранее настроенных CRM имеет два последствия. Во-первых, сложнее определить, как производительность модели зависит от процедур настройки и обучения. Во-вторых, это уменьшает эпистемологический смысл подгонки модели оценка, единственная доступная форма оценки модели. Более вероятно, что будет хорошая подгонка модели, независимо от того, является ли модель адекватно прогнозирующей вне выборки, потому что цель настройки и обучения состоит в том, чтобы оптимизировать подгонку модели к данным наблюдений и выходным данным CRM соответственно. Итеративное обучение NNP на предварительно настроенном CRM делает (3) наиболее вероятным объяснением соответствия модели.

    1. Возможные возражения


Некоторые могут возразить, что это беспокойство преувеличено. Пока переменные, оцениваемые на предмет соответствия модели, отличаются от параметров, подлежащих настройке методов, можно поддерживать эпистемическую ценность хорошего соответствия модели. На самом деле параметры CRM, которые, скорее всего, будут настроены специальным образом, например, параметры микрофизики облаков, а не переменные, связанные с непосредственно представленными конвективными облаками или крупномасштабными переменными, такими как температура. Когда NNP обучается на CRM, он оценивается на соответствие модели по отношению к средней климатической статистике, такой как средняя температура. Эта независимость от настраиваемых переменных и переменных, оцениваемых на соответствие, должна рассеять опасения по поводу зависимости соответствия или производительности от методов настройки.

Однако при разработке NNP мы занимаемся не только настройкой, но и настройкой в ​​сочетании с тренировочными практиками. Независимость больше не зависит только от переменной, оцениваемой на предмет соответствия, и настраиваемого параметра. Перед учеными стоит тройная задача: определить, зависит ли производительность от настройки, обучения или совокупного эффекта обучения модели на ранее настроенной CRM. Сложные зависимости возникают из практик и взаимодействий, которые охватывают три взаимосвязанных контекста: данные наблюдений, модель разрешения облачных вычислений и модель нейронной сети. Проще говоря, эпистемическая непрозрачность углубляется более чем одним способом (Alvarado & Humpreys 2017).

Кроме того, мы знаем, что модель нейронной сети обучается на данных CRM, касающихся тех же климатических переменных, для которых она впоследствии оценивается с использованием оценки соответствия модели. Например, в Rasp et al. (2018), NNCAM обучается на 140 миллионах обучающих выборок из SPCAM, что составляет около года обучающих данных для профилей температуры и ветра. Расп и др.

затем оцените способность NNCAM воспроизводить климат SPCAM с учетом профилей температуры и ветра (Rasp et al. 2018, 9685). Нейронные сети улучшают производительность с помощью методов обучения, эффективность которых зависит от зависимости между переменными, используемыми при обучении, и теми, которые оцениваются на соответствие выходным данным CRM. Обучение улучшает производительность, потому что оно использует именно тот тип зависимости, который ученые должны исключить, чтобы оценки соответствия модели имели эпистемическую ценность. В противном случае ученые рискуют перенастроить или перенастроить на прошлые или недавние условия, и «прогностическая точность модели вполне может ухудшиться, поскольку прогнозы СГПТ делаются все дальше и дальше в будущее» (Parker 2009, 239) — ошибка в обобщаемости.

    1. Значимость


Это вызывает серьезную озабоченность, поскольку оценка NNP сосредоточена на оценке соответствия модели. Расп и др. оценить моделирование гибридных МОЦ: (1) ключевые климатические статистические данные, такие как средний климат и изменчивость климата, (2) свойства, такие как энергосбережение, и (3) степень, в которой гибридная МОЦ может обобщать данные за пределами обучающих данных. Они делают это, сравнивая способность NNCAM воспроизводить климат SPCAM, форму оценки соответствия модели, ценность которой зависит от улучшенного статистического соответствия SPCAM данным наблюдений по сравнению с традиционной параметризацией. Расп и др. обнаружили, что гибридный GCM, NNCAM, успешно воспроизводит важные аспекты среднего климата модели обучения SPCAM, ключевые закономерности изменчивости климата и эффективно сохраняет энергию (Rasp et al. 2018, 9687). связанные со средней климатической статистикой, изменчивостью и термодинамическими принципами. Расп и др. утверждают, что нейронная сеть извлекла из набора данных две вещи: (1) концепцию сохранения энергии более высокого уровня и (2) физическую связь между входными и выходными переменными. Таким образом, они пришли к выводу, что производительность NNCAM «в некоторой степени неожиданна и представляет собой большое преимущество по сравнению с традиционными параметризациями» (Rasp et al. 2018, 9687), и в своем исследовании представили «сдвиг парадигмы» в проектировании подсетей. параметризации (Rasp et al. 2018, 9688).

Однако, если хорошее соответствие модели NNCAM модели CRM — будь то для средней статистики, изменчивости или термодинамики — связано с переобучением этого конкретного набора данных CRM, тогда соответствие модели является плохой проверкой способности NNCAM к обучению либо (1) концепция сохранения энергии более высокого уровня или (2) физическая связь между входными и выходными переменными. Отсутствие возможности обобщения NNCAM за пределами обучающих данных подтверждает приписывание производительности NNCAM тщательной настройке и обучению NNP.

Вопреки утверждениям Распа и др., NNP не удалось изучить какой-либо значимый основополагающий принцип или физические отношения между релятами. Скорее, NNP не может сделать точные или надежные прогнозы для температур, лежащих за пределами диапазона, к которому он неоднократно и итеративно подгонялся в соответствии с процедурой обучения. Ограниченный успех NNP в отношении обучающих данных связан с методами разработки и оценки, используемыми в связи с NNP, а не с тем, что NNP изучила или уловила лежащие в основе отношения, которые приводят к этим средним климатическим статистическим данным, изменчивости и т. д.

    1. Резюме

Улучшение и оценка представлений процессов являются основными средствами повышения надежности прогнозов модели и обеспечивают защиту от переобучения за счет физические/эмпирические ограничения на предсказания модели. Это особенно ценно в контексте NNP и других приложений машинного обучения, для которых переобучение является особенно серьезной проблемой из-за уникального сочетания методов настройки и обучения в процессе разработки. Но такие основанные на процессах формы улучшения и оценки моделей недоступны, потому что NNP прямо или косвенно не представляют климатические процессы. Это оставляет ученых с оценкой соответствия модели как единственной и основной формой оценки модели для NNP. Однако оценка соответствия модели не является устойчивой к чрезмерной подгонке и имеет ограниченную эпистемическую ценность из-за методов настройки и обучения, используемых при разработке модели ML. Таким образом, замена традиционных и облачных параметризаций параметризациями нейронной сети подрывает надежность проекций модели. Традиционные и облачные параметризации с разрешением прямо или косвенно представляли процессы, и это представление процесса имеет дополнительную и непреодолимую ценность для надежности прогнозов модели, поскольку оно обеспечивает (1) физические/эмпирические ограничения и

(b) облегчает формы разработки и оценки моделей, которые защищают от переобучения. Это особенно важно для получения надежных прогнозов на основе выборки. Появление методов машинного обучения, таких как нейронные сети, меняет разработку и оценку параметризации климатических моделей — не всегда к лучшему.
  1. Заключение


Одной из центральных целей разработки NNP Распом и др. было использование всех преимуществ улучшенного представления процессов CRM за небольшую часть вычислительных затрат (Rasp et al. 2018, 9684). Однако NNP не представляет эти процессы, он пытается обойти прямое и косвенное представление физических процессов, которые приводят к выходным данным, путем идентификации и воспроизведения количественных отношений, которые существуют между переменными в выходных данных CRM. Короче говоря, обученный NNP не может изучить конвекцию и обобщить данные обучения за ее пределами, потому что он не может представляют причинные конвективные процессы, которые связывают интересующие климатические переменные. Нельзя, как Rasp et al. надеялись, воспользоваться прогностическими преимуществами облачных моделей с высоким разрешением, не принимая во внимание ключевую причину их повышения производительности — прямое и улучшенное представление процессов подсетки, которые управляют прогнозами моделей. Само представление процессов добавляет значительную и незаменимую ценность для надежности прогнозов климатических моделей.


написать администратору сайта