Главная страница

81. Статистические методы, фильтрация и анализ спектров


Скачать 0.98 Mb.
Название81. Статистические методы, фильтрация и анализ спектров
Дата21.10.2022
Размер0.98 Mb.
Формат файлаdocx
Имя файла10685811_Otvetykbiletam8.docx
ТипЗадача
#747398
страница3 из 20
1   2   3   4   5   6   7   8   9   ...   20

83. Модели стационарных и нестационарных временных рядов, их виды и методы построения



Важное значение в анализе и прогнозировании на основе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Временной ряду{ = (1,2,..., п) называется строго стационарным, если совместное распределение вероятностей п наблюдений у {2, ???,уп такое же, как у« наблюдений у1+т, у2+т???,Уп+Т (при любых«, /их). Свойства строго стационарных рядов не зависят от момента времени Итак, для стационарного случайного процесса характерна неизменность во времени его основных вероятностных характеристик, таких, как математическое ожидание и дисперсия.

Под стационарными рядами понимаются однородные во времени случайные процессы, характеристики которых не меняются с течением времени /. Характеристики этих процессов и определяют особенности процессов и являются предметом исследования. Если эти характеристики (математическое ожидание, дисперсия и пр.) удалось с заданной степенью точности найти, то задача прогноза таких стационарных процессов становится чрезвычайно простой. В то же время стационарные процессы могут иметь самый различный характер динамики — изменение одной части из них не имеет ярко выраженных тенденций во времени, динамика другой части имеет явно выраженную тенденцию изменения во времени, которая может носить и очень сложный нелинейный характер. Таким образом, стационарная группа типов динамики временного ряда может быть, в свою очередь, разделена на две подгруппы: 1) простые стационарные; 2) сложные стационарные. Для первой группы факторов, простого стационарного типа, выполняется условие неизменности во времени их математического ожидания и других характеристик случайных процессов. Если же математическое ожидание и иные характеристики вероятностного процесса претерпевают изменение во времени, то такие ряды являются сложными стационарными.

Модели стационарных и нестационарных временных рядов

Простые стационарные процессы применительно к социально-экономическим объектам анализируются и прогнозируются с помощью простейших методов математической статистики (точечный и интервальный прогнозы динамики временного ряда). Чаще всего можно утверждать наличие закона нормального распределения, и поэтому основные усилия должны быть направлены на доказательство этого положения с помощью соответствующих статистических гипотез и методов их проверки, а после этого — на вычисление характеристик процесса. Если удалось подтвердить гипотезу о нормальном характере распределения изучаемого ряда, то лучшей оценкой его математического ожидания выступает средняя арифметическая, а лучшей оценкой дисперсии — выборочная дисперсия. Причем здесь уместен основной принцип выборочного метода — чем больше наблюдений, тем лучше оценки модели.

Сложные стационарные процессы свидетельствуют о наличии множества факторов, воздействующих на объект, показатели которого меняются во времени. Поэтому задачей прогнозиста является выявление главных из этих факторов и построение модели, описывающей влияние главных факторов на объект прогнозирования. Если этих факторов много, и выделить главные по каким-то соображениям невозможно, считают, что время выступает таким обобщающим фактором, и находят модель зависимости между прогнозным показателем и временем. Как правило, в этих случаях исследователю неизвестно большинство основных характеристик случайного динамического стационарного процесса. Он должен по данным наблюдений за процессом найти эти характеристики. Здесь исследователь вынужден прибегать к некоторым априорным предположениям — допускать наличие того или иного закона распределения вероятностей, свойств процесса и его взаимосвязей, характера динамики и т.п. В данном случае наиболее эффективно может использоваться тот раздел экономической науки, который получил название эконометрики.

Так как статистические свойства сложных стационарных рядов не

изменяются со временем, то эти их свойства можно накопить и выявить с помощью вычисления некоторых функций отданных. Функция, которую впервые использовали для этой цели, является автокорреляционной функцией (АКФ). Степень тесноты связи между последовательностями наблюдений временногорядауру2—,у иу1+ту2+х, •••’ Уп+х обычно определяют с помощью выборочного коэффициента корреляции г(т). Его формула приведена ниже:

/7-Т

/7-Т /7-Т



/ = 1

/ = 1 / = 1

/7-Т ( /7-Т Л ^

(л-т)2>,2- 5>,

/=1 V /=1

Хп-'шАЪ.

/7-т

  • 1=

  • (6.5)

/+т

V /=1 /

где т — число периодов, по которым рассчитывается коэффициент автокорреляции (лаг).

Этот коэффициент оценивает корреляцию между уровнями одного и того же ряда, поэтому иногда его называют коэффициентом автокорреляции. Формулу расчета коэффициента автокорреляции 1-го порядка (при т = 1) можно представить следующим образом:

где

1-2

/7

/7

  • (6.6)

  • 2



  • у)2

  • 1=2 1=2

 

(6.7)

Коэффициент автокорреляции 2-го порядка определяется по формуле



  • 1=3

  • (6.8)

  • — 2

  • 1=3

г=3

где

  • 1л 5>н

  • (6.9)

/7 — 2 /7-2

С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило — максимальный лаг должен быть не больше п/6. Функция г(т) называется выборочной автокорреляционной функцией, а ее график — коррелограм-мой. Вид выборочной автокорреляционной функции тесно связан со

й =1=3

; у, = "3

структурой ряда.

  • 1. Автокорреляционная функция г(т) для «белого шума» при т > О также образует стационарный временной ряд со средним значением нуль.

  • 2. Для стационарного ряда АКФ быстро убывает с ростом т. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой.

  • 3. В случае выраженной сезонности в графике АКФ также присутствуют «выбросы» для запаздываний, кратных периоду сезонности, но эти «выбросы» могут быть завуалированы наличием тренда или большой дисперсией случайной компоненты.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка т, то ряд содержит циклические колебания с периодичностью в т моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположении относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит ярко выраженную нелинейную тенденцию, для выявления которой необходимо провести дополнительный анализ. Поэтому коэффициент автокорреляции и автокорреляционную функцию целесообразно использовать для выявления во временном ряде трендовой компоненты и циклической (сезонной) компоненты. Таким образом, при изучении сложных стационарных временных рядов основной задачей является выявление и устранение автокорреляции.

Нестационарные процессы в противоположность стационарным отличаются тем, что они меняют во времени все свои характеристики. Причем это изменение может быть столь существенным, что динамика одного показателя будет отражать развитие совершенно разных процессов. Все взаимосвязи и взаимозависимости объекта прогнозирования меняются во времени. Более того, меняется во времени и структура и направление взаимодействия элементов, составляющих объект прогнозирования. В зависимости от того, насколько меняются во времени приращения АУ(Т), нестационарные процессы также могут быть выделены в две подгруппы: 1) эволюционные процессы; 2) хаотические процессы.

Если приращения АУ(Т) постепенно увеличиваются с течением времени в результате количественных и качественных изменений, происходящих в системе, отражением которой реализацией является нестационарный ряд, то эти процессы могут быть названы эволюционными. При этом отношение Д К(7)/Т(? + 7), характеризующее нарастание неопределенности, имеет увеличивающуюся со временем Т динамику — от нуля до бесконечности. В случае, когда приращения АУ(Т) не имеют какой-либо достаточно выраженной тенденции во времени и их изменения хаотичны (например, при первом же наблюдении АУ(Т) может быть достаточно велико в сравнении с самим показателем У(Т)), то такие процессы могут быть отнесены к хаотическим. Хаотический характер динамики возникает в тех случаях, когда или сам процесс неинерционен и динамика его развития легко меняется под воздействием внешних или внутренних факторов, или же когда на инерционный процесс воздействуют внешние факторы такой силы, что под их воздействием «ломаются» и внутренняя структура процесса, и его взаимосвязи, и его динамика. Иначе говоря, эволюционная динамика характеризует процесс адаптации объекта к внешним и внутренним воздействиям, а хаотическая динамика — отсутствие способности объекта к адаптации.

Сложный характер нестационарной динамики предопределяет и сложность аппарата моделирования и прогнозирования этой динамики. Прогнозирование эволюционных составляющих экономической конъюнктуры до последнего времени не попадало в поле зрения специалистов по социально-экономическому прогнозированию — только в последние годы в учебники по прогнозированию стали включаться соответствующие разделы. На практике эволюционные процессы просто не выделяли в отдельную группу и для их анализа и прогнозирования использовали приемы классической эконометрики, не задумываясь над корректностью такого применения. Именно использование аппарата прогнозирования, методологически несовместимого со свойствами объекта прогнозирования, и приводит к серьезным ошибкам при выборе инструментария и существенной дисперсии прогноза в практике прогнозирования социально-экономической динамики. Для прогнозирования временных рядов социально-экономических показателей эволюционного типа методологически обоснованным является применение адаптивных методов прогнозирования. Вопросы прогнозирования хаотических рядов социально-экономической динамики в настоящее время решаются с использованием теории хаоса и теории катастроф.

Далее рассмотрим методы прогнозирования часто наблюдаемых в практике социально-экономических исследований сложных стационарных и эволюционных нестационарных динамических процессов. Для рядов выше упомянутых типов английскими статистиками Д. Боксом и В. Дженкинсом в середине 1990-х гг. разработан алгоритм прогнозирования. В иерархию алгоритмов Бокса — Дженкинса входит несколько алгоритмов, самым известным и используемым из них является алгоритм АЯ1МА. Он встроен практически в любой специализированный пакет для прогнозирования. В классическом варианте ЛЯ1МА не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В настоящее время в научной литературе часто упоминаются варианты моделей АЯ1МА, позволяющие учитывать независимые переменные.

Модели АЯ1МА опираются в основном на автокорреляционную структуру данных. В методологии АЯ1МА не предусматривается какой-либо четкой модели для прогнозирования данного временного ряда. Задается лишь общий класс моделей, которые описывают временной ряд и позволяют как-то выражать текущее значение переменной через ее предыдущие значения. Потом алгоритм АЯ1МА, задавая параметры моделей, сам избирает наиболее приемлемую модель прогнозирования. Существует целая иерархия моделей Бокса — Дженкинса. Логично ее можно определить так:

АЯ(р) + МА(д) -> АЯМА(р, д) АЯМА(р, д)(Р, 0 ->

-? АЯ1МА(р, д, г)(Р, 0 Я) ... (6.10)

где АЯ(р) — авторегрессионная модель порядка р МА(д) — модель скользящей средней порядка д; АЯМА(р, д) — комбинированная модель авторегрессии и скользящей средней; АЯМА(р, д) (Р, О) — модель экспоненциального сглаживания; АЯ1МА{р, д, г) (Р, 0 Я) — моделирование нестационарного эволюционного процесса с линейным трендом.

Первые три модели аппроксимируют динамику сложных стационарных временных рядов, последующие две — динамику эволюционных нестационарных временных рядов. Модель считается приемлемой, если остатки (в основном малые) распределены случайно и не содержат полезной информации. Если заданная модель неудовлетворительна, процесс повторяется, но уже с использованием новой улучшенной модели. Подобная итерационная процедура повторяется до тех пор, пока не будет найдена удовлетворительная модель. Из этого момента заданная модель может использоваться для целей прогнозирования.

В модели АШМА уровень динамического ряда у определяется как взвешенная сумма предыдущих его значений и значений остатков ег — текущих и предыдущих. Она объединяет модель авторегрессии порядкар и модель скользящей средней порядка ц. Тренд включается в ЛШМА с помощью оператора конечных разностей ряда уг Для фильтрации линейного тренда используют разницы 1-го порядка, для фильтрации параболического тренда — разницы 2-го порядка и т.д. Разница й должна быть стационарной. Вид модели АШМА, адекватность ее реальному процессу и прогнозные свойства зависят от порядка авторегрессии р и порядка скользящей средней <7.

Ключевым моментом моделирования считается процедура идентификации — обоснования вида модели. В стандартной методике АШМА идентификация сводится к визуальному анализу авто-коррелограмм и основывается на принципе экономии, по которому {р + <7) < 2. Модель АШМА порядка (р, (1, <7) достаточно гибкая и описывает широкий спектр несезонных процессов. При наличии сезонных колебаний в модели учитывается их периодичность с лагом 5 (для квартальных данных 5 = 4, для помесячных 5 = 12), и аналогичного смысла параметрами (Ря, А?, 05). Таким образом, идентификацией временного ряда называется построение для ряда остатков адекватной модели, в которой остатки представляют собой «белый шум», а все регрессоры значимы.

Рассмотрим некоторые модели АШМА подробнее. Авторегрессионная модель порядка р имеет вид

У, = Ро + Р1 У,-1 + Р2Т/-2 + • • • + РРУ,-Р + е, {* = I 2, ..., п), (6.11)

где Р0, р., ..., р — некоторые константы; г( — уровень «белого шума», который может быть опущен.

Если исследуемый процесс у в момент Г определяется его значениями только в предыдущий период 7—1, то получаем авторегрессионную модель первого порядка

У, =Р0 +Р1Л-1 + е, (7 = 1,2,...,«), (6.12)

В моделях скользящей средней моделируемая величина задается линейной функцией от возмущений (остатков) в предыдущие моменты времени. Модель скользящей средней порядка д имеет вид

У,= е11е,-1-У2е,-2- — -У,е,-, (7 = 1,2,...,«), (6.13)

где ур у., ..., у — некоторые константы; е — ошибки.

Нередко используется комбинированная модель авторегрессии и скользящей средней, которая имеет вид

У, = Ро + Р.Л-, + РзЯ-2+- • • + РрУ'-р +?1 - У&-1 - У 2^-2 -???- У&-Я • (6.14)

Параметры р и <7 можно выбрать по следующим правилам:

  • 1) один параметр (р), если автокорреляционная функция (АКФ) экспоненциально убывает;

  • 2) два параметра авторегрессии (р), если АКФ имеет форму синусоиды или экспоненциально убывает;

  • 3) один параметр скользящего среднего (<7), если АКФ имеет резко выделяющееся значение на лаге 1, нет корреляции на других лагах;

  • 4) два параметра скользящего среднего (д), если АКФ имеет резко выделяющиеся значения на лагах 1 и 2 и нет корреляции на других лагах.

Адаптивное прогнозирование

При изучении нестационарных эволюционных временных рядов применяется адаптивное прогнозирование. Адаптивные методы прогнозирования — это совокупность моделей дисконтирования данных, способные приспосабливать свою структуру и параметры к изменению условий. При оценке параметров адаптивных моделей наблюдениям (уровням ряда) присваиваются различные веса в зависимости от того, насколько сильным признается их влияние на текущий уровень. Это позволяет учитывать изменения в тенденции, а также любые колебания, в которых прослеживается закономерность. Адаптивные методы прогнозирования представляют собой подбор и адаптацию моделей прогнозирования на основании вновь поступившей информации. К самым распространенным из них относится метод экспоненциального сглаживания и метод гармонических весов Хель-вига.

Метод экспоненциального сглаживания. Особенность его состоит в том, что в процедуре выравнивания каждого наблюдения используются только значения предыдущих уровней ряда динамики, взятых с определенным весом. Вес каждого наблюдения уменьшается по мере его удаления от момента, для которого определяется сглаженное значение. Сглаженное значение уровня ряда 5 на момент / определяется по формуле

5, = ау, + (1-а)5,_1, (6.15)

где 5 — значение экспоненциальной средней в момент /; 5/_1 — значение экспоненциальной средней в момент (/— 1); ? — значение экономического процесса в момент времени /; а — вес /-го значения ряда динамики (или параметр сглаживания, значения которого изменяются от нуля до единицы).

Последовательное применение формулы (6.15) позволяет вычислить экспоненциальную среднюю через значения всех уровней данного ряда динамики. Кроме того, на основе формулы (6.15) определяются экспоненциальные средние 1-го порядка, т.е. средние полученные непосредственно при сглаживании исходных данных ряда динамики. В тех случаях, когда тенденция после сглаживания исходного ряда определена недостаточно ясно, процедуру сглаживания повторяют, т.е. вычисляют экспоненциальные средние второго, третьего порядка и т.д., пользуясь выражениями (6.16—6.18):

^2] = ос?,[,]+(1-а)?,[3;

(6.16)

^] = а5,!2] + (1-а)^];

(6.17)

51,1*1 = а^*-1] + (1 - а)5^,

(6.18)

где 5^ — экспоненциальная средняя к-то порядка в точке I (к = 1,

2, 3,..., п).

Для линейной модели у = а0 + аи начальные условия следующие:

?[•] -а -а2(1а)а ^О(у) “О “р (у) “О а'

Экспоненциальные средние первого и второго порядка для этой модели:

5,1" = ау, + (1 ?- а)5™5,1" = а5|" + (1 - а)5Й

Прогноз осуществляется по формуле у * = я0 + я,/. Причем параметры а0 и а{ соответственно равны

 

  • (6.19)

  • (6.20)

Ошибка прогноза определяется по формуле

а , = о

У*

)/{Г-а)[* -4(1 -а) + 5(1 - а)2 + 2а(4-3а)

2 Л

/ + 2 а ч

(6.21)

где ъу — средняя квадратическая ошибка отклонения от линейного тренда.

Метод гармонических весов. Этот метод был разработан польским статистиком 3. Хельвигом. Он близок к методу простого экспоненциального сглаживания, использует тот же принцип. В его основе лежит взвешивание скользящего показателя, но вместо скользящей средней используется идея скользящего тренда. Экстраполяция про-

водится по скользящему тренду, отдельные точки ломаной линии взвешиваются с помощью гармонических весов, что позволяет более поздним наблюдениям придавать больший вес. Метод гармонических весов базируется на следующих предпосылках:

  • период времени, за который изучается экономический процесс, должен быть достаточно длительным, чтобы можно было определить его закономерности;

  • исходный ряд динамики не должен иметь скачкообразных изме-

нении;

  • социально-экономическое явление должно обладать инерционностью, т.е. для наступления существенного изменения в характеристиках процесса необходимо, чтобы прошло значительное время;

  • отклонения от скользящего тренда имеют случайный характер;

  • автокорреляционная функция, рассчитанная на основе последовательных разностей, должна уменьшаться с ростом /, т.е. влияние более поздней информации должно сильнее отражаться на прогнозируемой величине, чем на исходной информации.

Для получения точного прогноза методом гармонических весов необходимо выполнение всех вышеуказанных предпосылок для исходного ряда динамики. Для использования данного метода исходный ряд разбивается на фазы к. Число фаз должно быть меньше числа членов ряда п, т.е. к < п. Обычно фаза равна трем-пяти уровням. Для каждой фазы рассчитывается линейный тренд, т.е.

(6.22)

Ут = а, + V 0' = 1, 2,п - к + 1).

При этом для /, равного единице, Г = 1, 2,..., к; для /, равного двум, Г = 2, 3,..., к + 1; для /, равного п — к + 1, г = я — к + ,п — к +2,..., п. Для оценки параметров а.{ и Ьш используется метод наименьших квадратов. С помощью полученных (п — к + 1) уравнений определяются значения скользящего тренда. С этой целью выделяются те значения у(цу для которых Г = /, их обозначают у.^. Пусть их будет Пу Затем находится среднее значение ут по формуле



(6.23)

После этого необходимо проверить гипотезу о том, что отклонения от скользящего тренда представляют собой стационарный процесс. С этой целью рассчитывается автокорреляционная функция. Если значения автокорреляционной функции уменьшаются от периода к периоду, то пятая предпосылка данного метода выполняется. Далее рассчитываются приросты по формуле



Средняя приростов вычисляется по формуле

® = (6.25)

/=1

где С"+| — гармонические коэффициенты, удовлетворяющие условиям С”+1> 0 (/ = 1,2,п — 1) и ^С,"( = 1.

/=1

Выражение (6.25) позволяет более поздней информации придавать большие веса, так как приросты обратно пропорциональны времени, которое отделяет исходную информацию от более поздней для момента Г = п. Если исходная информация имеет вес т2 = /[п -1), то

вес информации, относящейся к следующему моменту времени, равен

т,=т2-1—-— = ——I—-—. (6.26)

3 2 п-2 п-1 /7-2

В общем виде ряд гармонических весов определяют как



1

= т, л--

/7-/

  • (/ = 2, 3, •••, п 1),

  • (6.27)

или

 

(6.28)

Отсюда

^ т,+1 =/7 -1. (6.29)

Чтобы получить гармонические коэффициенты С,",, удовлетворяющие двум вышеуказанным условиям, гармонические веса т+1 необходимо разделить на (п — 1), т.е.

С”, = ТЗиь (6.30)

п-1

Далее прогнозирование производится так же, как и при простых методах прогноза, путем прибавления к последнему значению ряда динамики среднего прироста, т.е.

У, = У/ + Ю (6.31)

при начальном условии У* = Уд,у Данный метод прогнозирования применяется, когда есть уверенность, что тенденция в будущем описывается плавной кривой, т.е. в ряду отсутствуют сезонные и циклические колебания. Таким образом, перед предвидением развития изучаемого объекта необходимо сделать вывод о стационарности или нестационарности временного ряда. Данное положение можно проверить с помощью теста Дики — Фуллера. Базовый порождающий данный процесс, который используется в тесте,— авторегрессионный процесс первого порядка:

у( = т0 + т{ •/ + г- у(_{ + е/? (6.32)

где т0, т{ иг — постоянные коэффициенты, которые могут быть найдены с помощью МНК; ? — случайная ошибка, которая в расчет может не приниматься.

Если выполняется условие 0 < г < 1, то ряд является стационарным. При г< 0 и г> 1, то изучаемый временной ряд не является стационарным.

1   2   3   4   5   6   7   8   9   ...   20


написать администратору сайта