курсовая по статистической аналитике. Курсовая работа по дисциплине Методы прогнозирования и анализ рынка
Скачать 2.07 Mb.
|
Построение модели авторегрессии и проинтегрированного скользящего среднего ARIMA(p,k,q)Модель авторегрессии и проинтегрированного скользящего среднего ARIMA(p,k,q) предназначена для описания временного ряда, имеющих порядок интеграции k, в виде ARMA(p,q) модели ряда разностей k–го порядка первоначального временного ряда: , где C, µj и – коэффициенты модели, p и q – порядки модели, – случайные величины, образующие «белый шум». Рассмотренные далее в пунктах 3.3 – 3.6 линейные модели можно понимать как частные случаи ARIMA(p,q) при k=0. p = 0 => MA(q) q = 0 =>AR(p) p ≠ 0, q ≠ 0 =>ARMA(p,q) Поскольку рассматриваемый временной ряд является нестационарным, т.е. имеет порядок интеграции k=1>0 (как установлено в пункте 3.1), то мы в каждом из пунктов 3.3–3.5 построим соответствующие модели для ряда разностей k–го порядка, являющегося стационарным. 3.2.1. Построение авторегрессионной модели AR(p)При построении аддитивной модели объясняющими переменными являются функции момента времени τ. В нашем случае (для линейной модели) объясняющие переменные – лаговые переменные yi–1, yi–2, …, yi–p. Модель AR(p): (где коэффициенты βj (j = 0…p) оцениваются с помощью пакета E’Views, p – порядок модели) Возмущения εi удовлетворяют условиям Гаусса–Маркова. P1. P2. P3. . При построении модели нужно решить следующие задачи: определение порядка p авторегрессионной модели временного ряда; оценивание коэффициентов βi. Рассмотрим решение первой задачи. Ρчаст(m) – частный коэффициент автокорреляции, соответствующий лагу m. Величина Ρчаст(m) определяется как коэффициент корреляции между двумя случайными величинами Y(),…,Y() случайных величин. Оценкой для Ρчаст(m) является выборочный частный коэффициент автокорреляции rчаст(m). Предположим, что все вычисленные частные коэффициенты автокорреляции значимы до порядка p включительно. Тогда можно принять порядок автокорреляции модели равным p. В нашем случае однозначно определить порядок p по коррелограмме не удается, поэтому будем определять порядок p подбором. Рассмотрим решение второй задачи. Наиболее часто используются следующие модели AR(p): авторегрессионная модель первого порядка (или модель AR(1)): авторегрессионная модель второго порядка (или модель AR(2)): Коэффициентыβj (j = 0…p) будем оценивать с помощью пакета EViews. Построим авторегрессионную модель первого порядка. Для этого необходимо в командной строке среды EViews написать следующий код: ls у car(1), где у–название временного ряда. Результат выполнения указанной команды приведен на рисунке 3.13. Рисунок 3.13 – Нахождение коэффициентов модели AR(1) Таким образом, построенная модель AR(1) имеет следующий вид: Построение модели скользящего среднего MA(q)Модель скользящего среднего MA(1) имеет следующий вид: где C, – коэффициенты модели, q – порядок модели, – случайные величины, образующие «белый шум». (порядок найдем перебором) Построим модель MA(1). Коэффициенты будем считать в пакете E’Views. Для этого необходимо в командной строке среды EViews написать следующий код: ls у cma(1), где у–название временного ряда. Результат выполнения указанной команды приведен на рисунке 3.14. Рисунок 3.14 – Нахождение коэффициентов модели MA(1) Таким образом, построенная модель MA(1) имеет следующий вид: – 289,9859 – 0.7016. Построение смешанной модели ARMA(p,q)Для достижения большей гибкости при построении модели ВР полезно включать в нее и авторегрессионные члены, и члены скользящего среднего. , где C, µj и – коэффициенты модели, p и q – порядки модели, – случайные величины, образующие «белый шум». Коэффициенты будем считать в пакете EViews. Построим модель ARMA(1,1). Коэффициенты будем считать в пакете E’Views. Для этого необходимо в командной строке среды EViews написать следующий код: ls у car(1) ma(1), где у–название временного ряда. Результат выполнения указанной команды приведен на рисунке 3.15. Рисунок 3.15 – Построение смешанной модели ARMA(1,1) Таким образом, построенная модель ARMA(1,1) имеет следующий вид: Сравнительный анализ построенных моделейДля выбора наиболее подходящей ARIMA(p,k,q) модели мы посчитаем в пакете EViews показатели адекватности для каждой модели, приведённые далее. Во всех формулах этого пункта приняты следующие обозначения: n – число фактических значений, m – число коэффициентов в модели, yi – фактическое наблюдение в i–тый момент, – расчётное наблюдение в i–тый момент. Приведённый индекс детерминации (Adjusted R–squared) рассчитывается следующим образом: где – индекс детерминации, введённый в пункте 2.3. Данный коэффициент позволяет сравнить модели с разным числом коэффициентов. Он учитывает число коэффициентов модели, вводя штраф за дополнительные регрессоры, которые не способствуют увеличению объясняющей силы регрессии. При включении в регрессию дополнительных переменных коэффициент может уменьшаться и может быть отрицательным, если модель плохо специфицирована. Стандартная ошибка регрессии (S.E. of regression) рассчитывается следующим образом: Чем меньше значение стандартной ошибки, тем адекватнее модель. F–статистика (F–statistic) рассчитывается следующим образом: Уравнение нелинейной регрессии значимо с уровнем значимости α, если При помощи F–статистики в предположении, что остатки модели распределены нормально, проверяется гипотеза о значимости регрессии в целом, т.е. о том, что коэффициенты при всех объясняющих переменных, включенных в модель, значимо отличаются от нуля. P–значение для F–статистики (Prob(F–Statistic)). Если значение меньше, чемвыбранный уровень значимости, то гипотезу о том, что все коэффициенты модели равны нулю, можно отвергнуть на этом уровне значимости. Заметим, что регрессия может быть значимой, даже если каждый коэффициент в отдельности не значим. Информационный критерий Акаике AIC (Akaike info criterion) рассчитывается следующим образом: Используется для выбора лучшей модели из некоторого набора альтернативных моделей: чем меньше значение критерия, тем лучше модель. Информационный критерий Шварца BIC или SC (Schwarz criterion) рассчитывается следующим образом: Используется для выбора лучшей модели из некоторого набора альтернативных моделей – чем меньше значение критерия, тем лучше модель. Всегда выбирает лучшую модель с числом параметров, не превышающим число параметров в модели, которая была выбрана по критерию Акаике. Критерий является асимптотически состоятельным, в то время как информационный критерий Акаике смещен в сторону выбора перепараметризованной модели. Hanna–Quinn Criterion Используется для выбора лучшей модели из некоторого набора альтернативных моделей – чем меньше значение критерия, тем лучше модель. В таблице 3.1 приведены расчётные значения показателей адекватности моделей AR(1), MA(1), ARMA(1,1), найденные с помощью пакета EViews. Таблица 3.1 – Показатели адекватности моделей AR(1), MA(1), ARMA(1,1)
В результате получено, что из рассматриваемых моделей наилучшей является модель AR(1), так как имеет наибольший приведенный коэффициент детерминации и наименьшую стандартную ошибку регрессии по сравнению с моделями MA(1) и ARMA(1,1). |