геостатистика реферат. 1. Понятие геостатистика 4 Рабочий поток для геостатических исследований 6
Скачать 85.43 Kb.
|
Оглавление1. Понятие «геостатистика» 4 2. Рабочий поток для геостатических исследований 6 3. Применения геостатистического подхода к прогнозированию 9 Заключение 15 Список литературы 16 Введение Актуальность работы. Геостатистика как совокупность математически обоснованных методов появилась в связи с задачами оценки содержания и запасов руд. Основы теории заложены Ж.Матероном. В частности, им разработана теория пространственной случайной функции (ПСФ) и указаны ограничения на ее свойства, позволяющие обосновать применение разработанных расчетных методов. Отдельные методы применялись и до появления работ Матерона, в частности горным инженером Криге, в честь которого и назван основной расчетный метод геостатистики - кригинг. Впоследствии геостатистический методы стали применяться в предметных областях, далеких от геологии руд, например, в метеорологии, под названием оптимальной интерполяции. Цель работы – изучить основы геостатистики. Задачи: - рассмотреть понятие «геостатистика»; - описать рабочий поток для геостатических исследований ; - выявить применения геостатистического подхода к прогнозированию. Объект исследования – геостатистика. Предмет исследования – основные понятия. Методы исследования – анализ, обобщение полученной информации. Структура работы состоит из введения, трех глав, заключения, списка литературы. 1. Понятие «геостатистика»Геостатистика — это раздел статистики, который занимается анализом и прогнозированием значений, связанных с пространственными и пространственно-временными явлениями[1]. Она включает пространственные (и в некоторых случаях временные) координаты анализируемых данных. Многие геостатистические инструменты изначально были разработаны в качестве практических средств описания пространственных моделей и интерполяции значений для местоположений, в которых не проводились измерения. Со временем такие инструменты и методы развивались и теперь предоставляют не только интерполированные значения, но и меры неопределенности для таких значений[10]. Измерение неопределенности крайне важно для обоснованного принятия решений, поскольку она предоставляет сведения о возможных значениях (результатах) для всех местоположений, а не только для одного проинтерполированного значения. Геостатистический анализ также прошел путь от одномерного до многомерного и сегодня предлагает механизмы, учитывающие вспомогательные наборы данных, которые дополняют (иногда немногочисленные) основные интересующие переменные, позволяя создавать более точные модели интерполяции и неопределенности. Геостатистика широко используется во многих областях науки и инженерных работ, например в следующих. •В горнодобывающей отрасли геостатистика используется на разных этапах проекта: сначала она позволяет количественно оценить объем минеральных ресурсов и определить экономическую рентабельность проекта, а затем по мере поступления обновленных данных геостатистика позволяет на регулярной основе принимать решения о том, какая порода должна направляться на обогатительную фабрику, а какая является отходами[2]. •В науках об окружающей среде геостатистика используется для оценки уровня загрязнения и позволяет определить, является ли такое загрязнение угрозой для экологии или здоровья человека и требует ли оно устранения последствий. •Относительно недавнее применение в почвоведении связано с картированием уровней питательных веществ в почве (азот, фосфор, калий и т. д.) и других показателей (включая электропроводность) с целью изучения их связи с урожаем и расчетом точных объемов удобрений для различных участков поля[9]. •В метеорологии геостатистика используется для прогнозирования температур, осадков и связанных явлений (например, кислотных дождей). •Недавно геостатистика стала применяться в области здравоохранения, например, для предсказания уровней загрязнения окружающей среды и их связи с частотой раковых заболеваний. Во всех этих примерах общим является наличие некоторого интересующего явления, которое присутствует в исследуемом ландшафте (например, уровень загрязнения почвы, воды или воздуха или наличие золота или другого металла в породе и т. д.). Масштабные исследования крайне затратны и требуют много времени, поэтому обычно явление исследуют на основании образцов, взятых в разных местах. Затем с помощью методов геостатистики составляются прогнозы (и оцениваются связанные меры неопределенности интерполяции). 2. Рабочий поток для геостатических исследованийГеостатистика - это класс статистических данных, использующихся для анализа и прогнозирования значений, связанных с пространственным или пространственно-временным явлением[3]. ArcGIS ArcGIS Geostatistical Analyst Extension предоставляет набор инструментов, позволяющих создавать модели, использующие эти пространственные (и временные) координаты. Эти модели могут быть применены в широком ряде сценариев, обычно они используются для интерполяции значений внеопорных местоположениях и измерения неопределенности этой интерполяции. Первый шаг, как и почти в любом многостраничном исследовании, — это тщательное изучение данных. Этот процесс начинается с картографирования набора данных с использованием классификации и цветовой схемы, позволяющих доступно отобразить важные характеристики, которые может содержать набор данных, например значительное увеличение значений с севера на юг, сочетание больших и маленьких значений без определенного порядка или более плотно отобранные зоны (преференциальная выборка), что может привезти к решению использовать декластеризованное взвешивание в анализе данных[4]. Вторая стадия — это построение геостатистической модели. Это может вызывать несколько шагов в зависимости от целей изучения (то есть тип (типы) информации, которую предположительно предоставляет модель) и характеристик набора данных, которые считались достаточно важными для включения[8]. На этой стадии информация, собранная во время тщательного исследования набора данных, и первичные знания о явлении, определяют уровень сложности модели и степень точности интерполируемых значений и мер неопределенности. Тогда как большое количество информации можно получить, тщательно исследуя набор данных, тем не менее важно включить любые сведения, которые могут быть об этом явлении. Разработчик не может полагаться только на набор данных, чтобы показать все важные характеристики. Те характеристики, которые не отобразятся, все еще могут быть включены в модель путем настройки значений параметров для отображения ожидаемого итога. Очень важно, чтобы модель была реалистичной, насколько это возможно, для точного представления интерполируемых значений и связанных с ними неопределенностей в качестве характеристики реального явления. Кроме предварительной обработки данных, в наборе данных может быть необходимо смоделировать пространственную структуру. Некоторые методы, такие как кригинг, требуют тщательного моделирования с использованием функций вариограммы или ковариации, тогда как другие методы, такие как обратные взвешенные расстояния, полагаются только на предполагаемую степень пространственной структуры, которую проектировщик должен предоставить на основе предварительных сведений об явлении[5]. Итоговым компонентом модели является поиск стратегии. Стратегия определяет, как много точек данных будет использоваться для вычисления значения для неопорного местоположения. Также можно задать их пространственную конфигурацию (положение относительно друг друга и неопорного местоположения). Оба фактора влияют на интерполируемое значение и связанную с ним неопределенность. Для большинства методов задан поиск эллипса вместе с количеством секторов эллипса, и количеством точек, взятых из каждого сектора, для интерполяции. После того как модель будет полностью задана, она будет использована вместе с набором данных для создания интерполируемых значений для всех неопорных местоположений, находящихся в области интереса. Итогом обычно является создание карты, показывающей значения моделируемой переменной. Итог выпадающих значений может быть исследован на этой стадии, поскольку эти значения, возможно, изменят значения параметра модели, и таким образом изменится интерполяция карты. В зависимости от метода интерполяции, также можно использовать похожую модель для вычисления мер неопределенности интерполируемых значений. Не все модели имеют эту возможность, поэтому важно вначале задать, необходимы ли измерения неопределенности. Это, в свою очередь, определит, какая из моделей является подходящей[6]. Поскольку используются все типы моделирования, результат моделирования необходимо проверить, то есть убедиться, что интерполируемые значения и связанные с ними меры неопределенности являются значимыми и соответствуют ожиданиям. После построения соответствующей модели, ее настройки и проверки результата, полученные результаты могут быть использованы в анализе рисков и принятия решений. 3. Применения геостатистического подхода к прогнозированиюБыло выполнено сравнение результатов геостатистического и детерминистского прогноза, построенного на основе уравнения водного баланса в предположении линейной зависимости прирашений уровня и объема, а также стока из озера и уровня[1]. В обоих случаях в качестве факторов использовались максимальный суммарный расход притоков Qmax и уровень Н0 озера на момент максимума расхода. Прогнозировались максимальные приращения уровней Hmax-H0, по которым легко вычислить прогноз значения Hmax. Использовались данные за период 1956-1990гг. В 1976, 1981 и 1990 годах рассматривались два максимума. Среднеквадратические ошибки (СКО) обоих прогнозов примерно равны (16см и 17см). Корреляция прогнозных и фактических значений весьма высокая (r>0.9). Эти оценки соответствуют длине ряда наблюдений за паводками, равной 37. Прогнозы обоих типов ближе друг к другу, чем каждый из них к факту (см. рис.1 и рис.2). Можно полагать, что основным источником ошибок прогноза в обоих случаях является неучет фактора осадков в период между моментом выдачи прогноза и наступлением максимума уровня. Для оценки точности прогнозирования обоими методами применялась процедура, известная в геостатистике под названием перекрестной проверки (cross validation [7]). Перекрестная проверка была применена вынужденно, поскольку из короткого ряда наблюдений не могла быть выделена контрольная выборка достаточной для статистических оценок длины. Оправданием может служить то, что время в качестве фактора не рассматривалось, и, с этой точки зрения, порядок следования наблюдений неважен. Кроме того, при перекресной проверке соблюдается основное условие верификации: фактическое значение предиктанта в момент прогноза не участвует ни на зтапе настройки модели, ни на этапе прогноза. На рис.1 изображены графики прогнозов (точнее - перекрестных оценок) обоими методами и график фактических значений максимальных уровней. Рис.1 Перекрестные оценки, имитирующие геостатистический и детерминистский прогноз максимального уровня оз. Ильмень при длине ряда наблюдений, равной 37 для всех точек[1] Рис.2 иллюстрирует реальную ситуацию: каждый прогноз выполнен с использованием только предшествующих наблюдений. Прогнозирование начато при длине ряда наблюдений, равной 15-ти. Оба метода дали близкие результаты, плохо различимые на графике, поэтому приведен график только геостатистического прогноза. Рис.2 Ретроспективные геостатистические прогнозы, для построения которых использованы только предшествующие наблюдения[1] Прогнозирование начато при длине ряда, равной 15. Детерминистский прогноз дал очень близкие результаты. На рис.3 представлен график зависимости СКО геостатистического прогноза от длины ряда наблюдений. Рис.3 Зависимость СКО геостатистического прогноза от длины ряда наблюдений[1] Аппроксимация проведена от руки. Можно полагать, что СКО спадает по экспоненте с асимптотой на уровне квадратного корня из ЭС. Чтобы выявить разницу в "поведении" прогнозных моделей, ослабили один из факторов: вместо суммарного расхода использовали только расход р.Мста в створе Девкино, контролирующего 30% площади бассейна. На рис.4 хорошо видно, что геостатистическая модель, опирающаяся только на данные (без поддержки разумной теорией), при малой длине ряда совершенно беспомощна. Она выходит на режим позже, чем модель на основе уравнения водного баланса и по мере накопления данных догоняет последнюю по качеству прогноза. Рис.4 То же, что и рис.2, но вместо суммарного расхода притоков использован лишь расход р.Мста[1] При ослабленном таким образом факторе стало заметно, что геостатистические прогнозы существенно хуже детеминистских при дифиците наблюдений. В отчете ВФ ГГИ приведены результаты прогноза уровня оз.Ильмень в периоды весеннего половодья 1984-1988 годов. Для этих лет в таблице 1 приведены ошибки прогноза максимальных уровней тремя методами. В данном случае прогнозы так же строились "честно", с использованием исключительно предшествующих наблюдений. Заметим, что по методике ВФ ГГИ прогнозировались не максимумы, а временные ряды, и значения Hmax выбиралось как максимальное значение в ряду. Таблица 1. Ошибки прогноза максимального уровня (в сантиметрах)[1]
Оценка точности этих прогнозов приведена в таблице 2. В отчете ВФ ГГИ статистическая оценка точности не приводится. Таблица 2. Среднеквадратические ошибки (СКО) прогноза уровня для разных упреждений[1]
В ходе работы с применением 1-ой версии программы были выполнены геостатистические ретроспективные прогнозы, идентичные по форме прогнозам ВФ ГГИ. Прогнозировался уровень озера с упреждением от 5 суток с пентадным шагом. Использовались три фактора - два указанных выше и дополнительные, различные для разных упреждений. ЗаключениеВ результате проделанной работы решены следующие задачи: рассмотрено понятие «геостатистика»; описан рабочий поток для геостатических исследований; выявлены применения геостатистического подхода к прогнозированию. В целом опыт геостатистического подхода к прогнозированию можно признать удачным. Этот вывод сделан, конечно, не только на основании приведенного выше примера. Выполнялись и другие прогнозы, иногда более точные, но менее интересные содержательно. Рассмотренная задача хороша еще и тем, что удалось между делом запрограммировать достаточно простую, но адекватную генетическую модель для сравнения. Безотносительно к методу прогноза весьма полезным этапом исследования представляется вариограммный анализ, поскольку позваляет судить об объяснимости изменений предиктанта изменениями значений выбранных факторов и получить оценку нижнего предела дисперсии прогноза при бесконечном росте длины ряда наблюдений. Если набор факторов несостоятелен, нет смысла перебирать методы. К сожалению, анизотропный вариограммный анализ в многомерном пространстве вызывает наибольшие затруднения. Трудозатраты на программную реализацию, видимо, сравнимы с таковыми при разработке обучающейся системы(ОС). Надежды на существенную экономию трудозатрат при выборе геостатистического подхода как альтернативы ОС не оправдались. С ростом длины ряда наблюдений моделирование вариограммы облегчается и растет надежность оценок ее параметров. Одновременно растет густота заполнения области изменения факторов точками наблюдений и уменьшается влияние деталей формы аппроксимирующей поверхности, определяемых вариограммой, на результат. Список литературыДемьянов В.В. Савельева Е.А. Геостатистика: теория и практика. Издательство «Наука», Москва, 2010, 327 с. Кужелев П. Д. О применении геостатистики в науках о Земле // Международный научно-технический и производственный журнал «НАУКИ О ЗЕМЛЕ». - №4-2012.- с.77-81 Ковалевский Е.В. Геологическое моделирование на основе геостатистики // EAGE. 2011. 117 с. Кузякова И.Ф., Романенков В.А., Кузяков Я.В. Применение метода геостатистики при обработке результатов почвенных и агрохимических исследований // Почвоведение. 2011, №11, с. 1365-1376. Куштин И.Ф. Геодезия: обработка результатов измерений: Учебное пособие.- М.: ИКЦ «МарТ», Ростов н/Д: издательский центр «МарТ». -2011. - 288 с. Маркузе Ю.И., Голубев В.В. Теория математической обработки геодезических измерений: Учебное пособие для вузов / Под общ. ред. Ю.И.Маркузе. - М.: Академический Проект; Альма Матер. 2010. - 247 с. ПерепечкинМ.В., Билибин С.И. Технологии использования принципиальных моделей при проведении этапа литологического моделирования залежи углеводородов в программном комплексе DV-Geo // Геоинформатика. 2007. №1. С. 9-14. Поротов Г.С. Математические методы моделирования в геологии: Учебник для вузов.- СПб.: СПбГГИ (ТУ).2012. -223 с. Савиных В.П. Концепции применения геоинформатики в инженерных изысканиях // Инженерные изыскания. 2012. - № 7. - С. 8-11 Цветков В.Я., Зайцева О.В. Геостатистика как инструмент управления // Геодезия и аэрофотосъемка. – 2014. – №5. – с. 134 - 137 |