Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов

Название	В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
Анкор	Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П..pdf
Дата	29.05.2018
Размер	3.08 Mb.
Формат файла
Имя файла	Эконометрика Введение в регрессионный анализ временных рядо - Но.pdf
Тип	Документы #19771
Категория	Экономика. Финансы
страница	6 из 30

1 2 3 4 5 6 7 8 9 ... 30

3.2. Оценивание коэффициентов модели
После того как произведена идентификация (стационарной) модели ARMA, т.е. на основании имеющихся наблюдений принято решение о значениях p, q
в модели
ARMA(p, q), порождающей данные, переходят к этапу оценивания коэффициентов модели. На этом этапе обычно используется метод максимального правдоподобия, который в конечном счете сводится к методу наименьших квадратов. За исключением некоторых наиболее простых случаев (например, модели AR(1)), эта задача решается итерационными методами, требующими задания некоторых “начальных” (“стартовых”) значений параметров, которые затем последовательно уточняются.
В качестве таких начальных значений можно использовать предварительные оценки, полученные на первом этапе. Такие начальные значения можно найти, приравнивая неизвестные “истинные” значения автокорреляций ρ(k) значениям r(k) выборочной автокорреляционной функции и используя функциональную связь между значениями ρ(k) и значениями коэффициентов модели. Например, если оценивается модель AR(p), то коэффициенты a
1
, …, a
p
определяются из системы первых p
уравнений Юла – Уокера
,
,
,
1
),
(
)
(
1
p
k
j
k
a
k
p
j
j
K
=
−
=
∑
=
ρ
ρ

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
13
в которые вместо неизвестных значений ρ(1), …, ρ(p) автокорреляций подставляются наблюдаемые (вычисляемые по реализации ряда) значения r(1), …, r(p) выборочных автокорреляций.
При оценивании моделей с MA(q) составляющей (q > 0) существенным оказывается условие обратимости, сформулированное в разд. 2.5. Покажем это на примере MA(1) модели
X
t
–
µ
= ε
t
+ bε
t–1
, t = 1, … , T .
Имея наблюдаемые значения x
1
, x
2
, … , x
T
, мы последовательно выражаем ε
1
, ε
2
,
… , ε
T
через эти значения и (ненаблюдаемое) значение ε
0
:
ε
1
= X
1
–
µ
– bε
0
,
ε
2
= X
2
–
µ
– bε
1
= X
2
–
µ
– b(X
1
–
µ
– bε
0
) = (X
2
–
µ
) – b(X
1
–
µ
) + b
2
ε
0
,
…
ε
T
= X
T
–
µ
– bε
T – 1
= (X
T
–
µ
) – b(X
T – 1
–
µ
) + b
2
(X
T – 2
–
µ
) –
+
(–1)
T – 1
b
T – 1
(X
1
–
µ
) + (–1)
T
b
T
ε
0
Максимизация (по b) условной функции правдоподобия, соответствующей наблюдаемым значениям x
1
, x
2
, … , x
T при фиксированном значении ε
0
, равносильна минимизации суммы квадратов
Q
(b) = ε
1 2
+ ε
2 2
+ … + ε
T
2
, которая является нелинейной функцией от b . Для поиска минимума этой суммы квадратов приходится использовать численные итерационные методы оптимизации, которые, в свою очередь, требуют задания начального (“стартового”) значения параметра b . Как мы уже говорили, такое стартовое значение может быть получено на этапе идентификации модели. Однако полученное в итоге итераций “оптимальное” значение b зависит от неизвестного нам значения ε
0
, что затрудняет интерпретацию результатов. Задача интерпретации облегчается, если выполнено условие обратимости ‌
b
‌ < 1, и при этом значение ‌ b ‌ существенно меньше 1.
Действительно, при выполнении этого условия можно просто положить ε
0
= 0 .
Эффект от такой замены истинного значения ε
0 на нулевое быстро убывает, так что сумма квадратов, получаемая в предположении ε
0
= 0, может служить хорошей аппроксимацией для суммы, получаемой при истинном значении ε
0
, при достаточно большом количестве наблюдений. Те же аргументы пригодны и для модели MA(q) с q
> 1 : в этом случае можно положить ε
0
= ε
–1
= … =
1
+
− q
ε
= 0 . Для получения более точной аппроксимации, в пакетах статистических программ (в том числе и в EVIEWS) предусмотрена процедура
(backcasting)
, в которой процесс итераций включает в себя также и оценивание значений ε
0
, ε
–1
, … ,
1
+
− q
ε
путем построения для них
“обратного
прогноза”
Если в результате оценивания получена модель, в которой условие обратимости не выполняется, рекомендуется повторить процедуру оценивания с использованием другого набора начальных значений.
Более подробное изложение процедур оценивания стационарных ARMA моделей методом максимального правдоподобия можно найти, например, в книге [Hamilton
(1994)]. Там же можно прочитать о том, каким образом вычисляются приближения для стандартных ошибок оценок коэффициентов этих моделей, которые можно использовать при большом количестве наблюдений обычным образом.
В заключение необходимо только сделать одно важное замечание.
Пусть мы имеем стационарную AR(p)модель
a
(L) X
t
= δ + ε
t

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
14
Мы уже говорили о том, что в этом случае математическое ожидание
µ
процесса
X
t
связано с константой δ соотношением
)
1
(
2 1
p
a
a
a
−
−
−
−
=
K
δ
µ
При этом можно сначала оценить коэффициенты a
1
, … , a
p
и δ , применяя обычный метод наименьших квадратов к модели
X
t
= δ + a
1
X
t–1
+ a
2
X
t–2
+ … + a
p
X
t–p
+ ε
t
, а затем, используя полученные оценки
δ
ˆ
и
ˆ
,
,
ˆ
1
p
a
a
, получить оценку для
µ
в виде
)
ˆ
ˆ
ˆ
1
(
ˆ
ˆ
2 1
p
a
a
a
−
−
−
−
=
K
δ
µ
Однако можно поступить и иначе, как это предусмотрено, например, в пакете
EVIEWS (Econometric Views), используемом нами в последующих примерах. Именно, мы можем записать ту же модель в виде
X
t
=
µ
(1 – a
1
–
a
2
–
…– a
p
) + a
1
X
t–1
+ a
2
X
t–2
+ … + a
p
X
t–p
+ ε
t
и одновременно оценивать и a
1
, … , a
p
и
µ
. Такая процедура теоретически более эффективна. Однако в такой форме модель оказывается нелинейной по параметрам, и это обстоятельство, как и при оценивании MA моделей, требует применения нелинейного метода наименьших квадратов (NLLS – nonlinear least squares) и численных итерационных методов оптимизации.
Пример
Рассмотрим данные о годовом потреблении рыбных продуктов в США (на душу населения, в фунтах).
946
0.8
956
0.4
947
0.3
957
0.2
948
1.1
958
0.6
949
0.9
959
0.9
950
1.8
960
0.3
951
1.2
961
0.7
952
1.2
962
0.6
953
11.4
963
0.7
954
1.2
964
0.5

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
15
955
0.5
965
0.9
График этого ряда:
10.0 10.5 11.0 11.5 12.0 46 48 50 52 54 56 58 60 62 64
X
Коррелограмма, построенная по этим данным, имеет вид
Autocorrelati on
Partial
Correlation
A
C
PAC
Q-Stat Prob
. |***
. |***
0
.429 0
.429 4
.2694 0
.039
. |***
. |**
0
.366 0
.222 7
.5350 0
.023
. | .
**| .
0
.059
-
0.204 7
.6255 0
.054
. | .
. | .
0
.016
-
0.034 7
.6324 0
.106
*| .
*| .
-
0.156
-
0.129 8
.3498 0
.138
**| .
**| .
-
0.255
-
0.195 1
0.393 0
.109
***| .
*| .
-
0.321
-
0.123 1
3.879 0
.053
. *| .
. |*
-
0.133 0
.175 1
4.523 0
.069
Ориентируясь на указанные ранее приближенные критерии, прежде всего найдем значение 2/√T = 2/√20 = 0.447. Из полосы ± 0.447 не выходит ни одна из выборочных автокорреляций и частных автокорреляций. Поэтому с точки зрения этих критериев, мы не должны отвергать гипотезу о том, что наблюдаемый ряд порождается моделью
MA(0)
X
0
= µ + ε
t
.
С другой стороны, если ориентироваться на критерий Люнга – Бокса, то пик ACF на лаге 1 является статистически значимым. Это означает, что в качестве потенциальных моделей порождения данных можно предварительно рассматривать модели AR(1) и MA(1). Таким образом, мы сталкиваемся здесь с конфликтной ситуацией: статистические выводы, получаемые при использовании разных критериев, не соответствуют друг другу. Подобная ситуация не является чем-то исключительным и достаточно часто встречается при идентификации модели, порождающей наблюдаемый ряд, тем более, что используемые критерии – асимптотические, тогда как обычно в распоряжении исследователя имеется не слишком большое количество наблюдений.

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
16
Последнее обстоятельство связано в значительной степени с тем, что для многих экономических рядов периоды, на которых порождающая ряд модель может считаться стационарной, обычно непродолжительны из-за изменения общей экономической обстановки, в которой эволюционирует рассматриваемый ряд. Это соображение можно легко проиллюстрировать на примере того же самого ряда данных о потреблении рыбных продуктов в США, если привлечь дополнительно статистические данные за период с 1940 по 1945 годы (годы Второй мировой войны). Эволюция ряда на расширенном периоде с 1940 по 1965 годы представлена следующим графиком:
7 8
9 10 11 12 40 42 44 46 48 50 52 54 56 58 60 62 64
X
Провал траектории ряда в 1942 – 1944 г.г. не позволяет трактовать этот ряд как стационарный на всем периоде с 1940 по 1965 годы. Поэтому мы продолжаем далее рассматривать значения ряда только на послевоенном периоде – с 1946 по 1965 г.г.
Если остановиться на модели AR(1), то для нее, как мы знаем, ρ(1) = a
1
.
Поэтому приравнивая неизвестное значение ρ(1) значению r(1) = 0.429, мы получаем предварительную оценку для неизвестного значения a
1
.
В то же время, производя непосредственное оценивание модели AR(1) с ненулевым математическим ожиданием нелинейным методом наименьших квадратов, получаем следующие результаты.
Dependent Variable: X
Method: Least Squares
Sample(adjusted): 1947 1965
Included observations: 19 after adjusting endpoints
Convergence achieved after 3 iterations
Variable Coef
Std.
Error t-
Statistic
Pro b.
C 10.8 1451 0.159 261 67.90 445 0.0 000
AR(1) 0.43 0515 0.219 257 1.963 522 0.0 662
R-squared 0.18 4864
Mean dependent var
10.
81053
Adjusted R- squared
0.13 6915
S.D. dependent var
0.4 25434
S.E. of regression
0.39 5238
Akaike info criterion
1.0 80645
Sum squared resid
2.65 5627
Schwarz criterion
1.1 80060
В данной ситуации уточненная оценка практически совпадает с предварительной оценкой для a
1
Если же остановиться на модели MA(1), то в такой модели ρ(1) = b
1
/(1 + b
1 2
).
Приравнивание неизвестного значения ρ(1) значению r(1) = 0.429 приводит к уравнению b
1
/(1 + b
1 2
) = 0.429. Корни последнего уравнения равны 0.567 и 1.704.

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
17
Первый корень соответствует обратимой MA(1) модели; второй корень соответствует необратимой MA(1) модели. Уточненное оценивание MA(1) модели с использованием обратного прогноза (backcasting) дает следующие результаты.
Dependent Variable: X
Method: Least Squares
Sample: 1946 1965
Included observations: 20
Convergence achieved after 13 iterations
Backcast: 1945
Variable Coef
Std.
Error t-
Statistic
Pro b.
C 10.8 1379 0.113 355 95.39 726 0.0 000
MA(1) 0.28 0610 0.228 102 1.230 195 0.2 345
R-squared 0.11 7961
Mean dependent var
10.
81000
Adjusted R- squared
0.06 8959
S.D. dependent var
0.4 14094
S.E. of regression
0.39 9561
Akaike info criterion
1.0 97739
Sum squared resid
2.87 3684
Schwarz criterion
1.1 97313
Log likelihood
-
8.977395
F-statistic
2.4 07257
Durbin-Watson stat
1.78 9895
Prob(F-statistic)
0.1 38178
В этом случае уточненное значение коэффицента b
1 существенно отличается от предварительной оценки этого коэффициента. Отметим также большое отличие P- значений для t- и F-статистик в отношении значимости коэффициента b
1
. Это можно объяснить тем, что величина стандартной ошибки вычисляется согласно асимптотической процедуре, тогда как в нашем распоряжении имеется всего лишь 20 наблюдений.
Если не производить обратного прогнозирования значения инновации для 1945 года, то результаты получаются близкими:
Dependent Variable: X
Method: Least Squares
Sample: 1946 1965
Included observations: 20
Convergence achieved after 24 iterations
Backcast: OFF
Variable Coef ficient
Std.
Error t-
Statistic
Pro b.
C 10.8 1515 0.112 582 96.06 431 0.0 000
MA(1) 0.27 4024 0.229 231 1.195 405 0.2 474
R-squared 0.11 6800
Mean dependent var
10.
81000
Adjusted
R-
0.06
S.D. dependent
0.4

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
18
squared 7734 var
14094
S.E. of regression
0.39 9824
Akaike info criterion
1.0 99054
Sum squared resid
2.87 7464
Schwarz criterion
1.1 98628
Log likelihood
-
8.990543
F-statistic
2.3 80443
Durbin-Watson stat
1.77 8286
Prob(F-statistic)
0.1 40261
3.3. Диагностика оцененной модели
После выбора типа и оценивания коэффициентов модели производится
диагностика
оцененной модели, т.е. выяснение того, насколько хорошо модель соответствует данным наблюдений (адекватна данным наблюдений) – это является третьим этапом процедуры подбора модели.
Для целей диагностики можно использовать целый ряд различных статистических процедур, которые направлены в основном на проверку гипотезы H
0 о том, что в модели, порождающей наблюдения, последовательность ε
t
действительно образует процесс белого шума.
Пусть мы остановили свой выбор на этапе идентификации на модели ARMA(p, q)
a
(L) X
t
= b
(L) ε
t
, т.е.
X
t
= a
1
X
t–1
+ … + a
p
X
t–p
+ ε
t
+ b
1
ε
t–1
+ … + b
q
ε
t–q
, и на втором этапе оценили ее как
t
t
L
b
X
L
a
ε
)
(
ˆ
)
(
ˆ
=
,
где
p
p
L
a
L
a
L
a
ˆ
ˆ
1
)
(
ˆ
1
−
−
−
=
K
,
q
q
L
b
L
b
L
b
ˆ
ˆ
1
)
(
ˆ
1
+
+
+
=
K
Если MA составляющая модели ARMA(p, q) обратима, то тогда
)
(
)
(
L
b
L
a
t
=
ε
X
t
, и оценки для ε
t
теоретически можно получить заменой a(L) и b(L) на
)
(
ˆ L
a
и
)
(
ˆ L
b
, соответственно:
t
t
X
L
b
L
a
)
(
ˆ
)
(
ˆ
ˆ =
ε
На практике, конечно, мы можем использовать эту формулу лишь частично, поскольку бесконечный ряд в правой части приходится обрывать из-за наличия только конечного количества наблюдений.
При большом количестве наблюдений поведение
t
ε
ˆ
должно имитировать поведение самих ε
t
. Cледовательно, если ошибки ε
t
образуют процесс белого шума, то остатки должны имитировать процесс белого шума.

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
19
Основываясь на этом соображении, Бартлетт [Bartlett (1946)] и Бокс и Пирс [Box,
Pierce (1970)] предложили исследовать статистическую значимость выборочных автокорреляций для ряда инноваций ε
t
∑
∑
=
−
=
+
=
T
t
t
k
T
t
k
t
t
k
r
1 2
1
ˆ
ˆ
ˆ
)
(
ε
ε
ε
ε
и суммы их квадратов
)
(
1 2
k
r
T
Q
M
k
BP
∑
=
=
ε
(Q-статистика Бокса – Пирса)
Если модель правильно специфицирована, то Q
BP
имеет распределение, которое близко к распределению χ
2
(M – p – q), при условии, что T и M велики, а отношение
(M/T) мало. Гипотеза адекватности подобранной модели отвергается, если
Q
BP
> χ
2 0.95
(M – p – q).
Однако впоследствии было замечено, что при конечных T распределение статистики Q
BP
может существенно отличаться от распределения χ
2
(M – p – q).
Используя результаты Люнга и Бокса [Ljung, Box (1978)], можно показать, что
( )
2 2
)
5
(
)
(
+
+
−
−
−
≈
T
M
M
q
p
M
Q
E
BP
Следовательно, если отношение M(M + 5)/(2T + 2) существенно, то использование χ
2
(M – p – q) приближения не является оправданным.
Люнг и Бокс предложили два способа преодоления проблемы смещения. Первый – прямой метод – состоит в использовании приближения
Q
BP
≈ χ
2
(E(Q
BP
)) , где для E(Q
BP
) используется указанное выше выражение (модифицированный критерий Бокса – Кокса).
Второй способ учитывает более точное выражение для D(r
ε
(k))
– вместо (1/T) берется (T – k)/(T
2
+ 2T). Это приводит к
Q-статистике Люнга – Бокса
(
)
∑
=
−
+
=
M
k
LB
k
T
r
T
T
Q
1 2
)
2
(
ε
, которая имеет то же асимптотическое распределение χ
2
(M – p – q), что и Q
BP
, но зато при конечных T распределение статистики Q
LB
гораздо ближе к χ
2
(M – p – q), чем распределение статистики Q
BP
. При этом качество приближения ухудшается, если значения параметров находятся вблизи границы стационарности или обратимости модели; особенно это заметно при малых M . Заметим, что хотя первоначально вывод асимптотического распределения статистики Люнга – Бокса производился в предположении, что ε
t
– гауссовский белый шум, в дальнейшем было установлено, что этот критерий достаточно устойчив к отклонениям распределения ε
t
от нормального.
Важно только, чтобы была конечной дисперсия D(ε
t
). ( Последнее условие часто нарушается для рядов, описывающих эволюцию быстро изменяющихся финансовых показателей – цен на акции, биржевых индексов, обменных курсов. Для таких рядов распределение ε
t
обычно имеет
“тяжелые” хвосты
, т.е достаточно часто наблюдаются большие по абсолютной величине значения ε
t
. И это требует привлечения для описания таких рядов более сложных моделей.)

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
20
В пакете EVIEWS в распечатке результатов оценивания моделей ARMA рядом с коррелограммой ряда остатков приводятся P-значения для наблюдаемых значений Q–
статистики Люнга – Бокса.
Для только что рассмотренных моделей AR(1) и МA(1) коррелограммы рядов остатков имеют следующий вид.
Для модели AR(1):
A
CF
P
ACF
A
C
PAC
Q-Stat Prob
*| .
*| .
-
0.096
-
0.096 0
.2033
. |**
. |**
0
.271 0
.265 1
.9334 .164
*| .
*| .
-
0.116
-
0.078 2
.2687 .322
. |*
. | .
0
.076
-
0.008 2
.4232 .489
*| .
. | .
-
0.099
-
0.049 2
.7024 .609
*| .
*| .
-
0.125
-
0.175 3
.1852 .671
**| .
**| .
-
0.257
-
0.260 5
.3801 .496
. | .
. | .
0
.019 0
.051 5
.3928 .612
. | .
|*
0
.047 0
.189 5
.4826 .705
*| .
**| . 0
-
0.178
-
0.259 6
.8945 .648
. | .
. | . 1 0
.040
-
0.050 6
.9748 .728
*| .
*| . 2
-
0.187
-
0.132 8
.9579 .626
Для модели MA(1):
A
CF
P
ACF
A
C
PAC
Q-Stat Prob
. |*
. |*
0
.100 0
.100 0
.2306
. |***
. |***
0
.365 0
.358 3
.4838 .062
. | .
*| .
-
0.050
-
0.127 3
.5491 .170
. | .
*| .
0
.058
-
0.068 3
.6417 .303

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
21
*| .
*| .
-
0.139
-
0.088 4
.2051 .379
*| .
*| .
-
0.169
-
0.182 5
.1071 .403
*| .
**| .
-
0.277
-
0.199 7
.6991 .261
*| .
. |*
-
0.066 0
.094 7
.8603 .345
. | .
. |*
-
0.021 0
.159 7
.8772 .446
*| .
**| . 0
-
0.187
-
0.302 9
.4191 .400
. | .
. | .
1 0
.002
-
0.042 9
.4192 .493
*| .
*| .
2
-
0.187
-
0.104 1
1.338 .415
В обоих случаях все P-значения для статистики Q
LB
больше 0.05, так что гипотеза о том, что в специфицированных моделях составляющие ε
t
образуют процесс белого шума, не отвергается. Заметим также, что в обоих случаях не отвергается гипотеза нормальности распределения ε
t
: P-значения критерия Jarque – Bera равны, соответственно, 0.480 и 0.608. Об оправданности применения последнего критерия при анализе временных рядов будет сказано ниже.
Проверка предположения о нормальности
Многие статистические процедуры, используемые при анализе временных рядов, опираются на предположение гауссовости (нормальности) анализируемого ряда.
Последнее означает, что для любого набора t
1
, …, t
n
случайные величины
n
t
t
X
X
,
,
1
K
имеют совместное нормальное распределение.
Имея в распоряжении одну единственную реализацию временного ряда, просто невозможно проверить справедливость такого утверждения. В то же время, еще возможно проверить гипотезу о нормальности одномерного (маргинального) распределения стационарного временного ряда. Соответствующая процедура была предложена в работе Ломницкого [Lomnicki (1961)]. Пусть
(
)
∑
=
−
=
T
t
k
t
k
X
X
T
m
1 1
,
3
,
2 2
4 2
2
/
3 2
3 1
−
=
=
m
m
G
m
m
G
В указанной работе было доказано, что если X
t
– стационарный гауссовский временной ряд, то при больших T статистики G
1
и G
2 имеют приближенно нормальные распределения с нулевыми математическими ожиданиями и дисперсиями
)
(
24
)
(
,
)
(
6
)
(
4 2
3 1
k
T
G
D
k
T
G
D
k
k
∑
∑
∞
∞
−
=
∞
∞
−
=
=
=
ρ
ρ

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
22
Оценить эти дисперсии можно, заменив бесконечные суммы степеней автокорреляций ρ(k) конечными суммами степеней выборочных автокорреляций r(k).
Используя такие оценки
),
(
ˆ
1
G
D
),
(
ˆ
2
G
D
получаем статистики
)
(
ˆ
,
)
(
ˆ
2 2
2 1
1 1
G
D
G
G
G
D
G
G
=
=
∗
∗
, которые при гипотезе нормальности имеют распределения, аппроксимируемые стандартным нормальным распределением. Поскольку последние статистики еще и асимптотически независимы, то при T → ∞
( ) ( )
)
2
(
2 2
2 2
1
χ
≈
+
∗
∗
G
G
Моделирование показывает, однако, что при умеренных значениях T распределениестатистики
∗
2
G
плохо приближается нормальным распределением.
Более того, процедура проверки здесь весьма общая (структура временного ряда не специфицируется). Поэтому критерий нормальности, основанный на статистике
( ) ( )
2 2
2 1
∗
∗
+ G
G
, имеет довольно низкую мощность при применении его к моделям AR и
MA, т.е. слишком часто не отвергает гипотезу нормальности ряда X
t
, когда она не верна.
Более подходящей является в этом отношении аналогичная процедура, применяемая не к самому ряду X
t
, а к остаткам, полученным при оценивании специфицированной модели ряда X
t
. В моделях AR и MA остатки состоятельно оценивают инновации ε
t
, которые, в предположении нормальности, являются независимыми, одинаково распределенными случайными величинами, имеющими распределение N(0, σ
2
). Поэтому при применении метода Ломницкого для проверки предположения о нормальности инноваций, мы получаем:
,
24
)
(
,
6
)
(
2 1
T
G
D
T
G
D
=
=
(т.к. для ряда инноваций ρ(k) = 0 при k ≠ 0),
,
24
,
6 2
2 1
1
G
T
G
G
T
G
=
=
∗
∗
так что
( ) ( )






+
=
+
∗
∗
24 6
2 2
2 1
2 2
2 1
G
G
T
G
G
, а это есть статистика, используемая для проверки нормальности в популярном критерии Jarque – Bera [Jarque, Bera
(1980)].
Таким образом, критерий Jarque – Bera можно использовать не только в рамках классической модели регрессии (с фиксированными значениями объясняющих переменных), но и для проверки нормальности инноваций в моделях временных рядов, помня, конечно, о том, что это всего лишь асимптотический критерий. Для улучшения приближения статистики критерия распределением хи-квадрат, в пакете EVIEWS в статистике критерия вместо множителя T используется множитель (T– K), где K –
количество коэффициентов, оцениваемых при построении модели исследуемого ряда.
Правда, здесь мы не заметили еще одного ”подводного камня”. Мы предполагали неявно, что остатки берутся как результат оценивания правильно идентифицированной модели. Как будет влиять на свойства критерия неправильное определение порядка модели?

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
23
При больших T критерий Шварца достаточно надежно определяет порядок (p, q) модели ARMA, так что проверка нормальности инноваций по модели, выбранной критерием Шварца, асимптотически равносильна проверке нормальности инноваций по правильно идентифицированной модели.
На третьем шаге производят также проверку выбранной модели на
“оптимальность”, имея в виду, что “более сложные” модели не должны существенно отличаться от подобранной модели. Точнее говоря, при увеличении порядка модели оценки коэффициентов при добавленных составляющих должны быть статистически незначимыми, а оценки коэффициентов при сохраняемых составляющих должны изменяться не очень существенно.
Пример
Обращаясь опять к результатам оценивания MA(1) и AR(1) моделей для данных о потреблении рыбных продуктов в США, замечаем, что гипотеза H
0
: a
1
= 0 в AR(1) модели и гипотеза H
0
: b
1
= 0 в МA(1) модели не отвергаются. Это означает, что обе эти модели могут быть редуцированы к модели MA(0)
X
t
= µ + ε
t
Оценивая последнюю, получаем:
Variable Coef
Std.
Error t-
Statistic
Pro b.
C 10.8 1000 0.092 594 116.7 460 0.0 000
R-squared 0.00 0000
Mean dependent var
10.
81000
Adjusted R- squared
0.00 0000
S.D. dependent var
0.4 14094
S.E. of regression
0.41 4094
Akaike info criterion
1.1 23258
Sum squared resid
3.25 8000
Schwarz criterion
1.1 73045
Log likelihood
-
10.23258
Durbin-Watson stat
1.1 38735
Но оцененная коррелограмма для этой модели была уже приведена выше, в самом начале рассмотрения данного примера, и именно она дала повод рассматривать в качестве возможных кандидатур модели AR(1) и MA(1). При этом, решая вопрос о статистической значимости ρ(1) и ρ
part
(1), мы опирались на асимптотические результаты, хотя имели в распоряжении лишь небольшое количество наблюдений, и это может быть причиной несогласованности полученных выводов.
Впрочем, мы можем воспользоваться и точным критерием, основанным на статистике Дарбина – Уотсона. Поскольку в последней модели нет никаких объясняющих переменных кроме константы, можно получить таблицы непосредственно для критических значений этой статистики, а не для границ, между которыми заключены эти критические значения. Соответствующие критические значения приведены в работе [Sargan, Bhargava (1983)] . В частности, для уровня значимости 0.05 и T= 21 критическое значение равно 1.069. Ориентируясь на него, мы не отвергаем гипотезу о том, что наблюдаемые данные порождены процессом MA(0).
Сравним оцененные модели MA(0), MA(1) и AR(1) по критериям Акаике и Шварца.

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
24
M
A(0)
M
A(1)
A
R(1)
IC
1
.123 1
.098 1
.081
IC
1
.173 1
.197 1
.180
Предпочтительной по критерию Акаике является модель AR(1), тогда как с точки зрения критерия Шварца более предпочтительна модель MA(0). Такое положение в практическом анализе временных рядов возникает достаточно часто: если критерии
Акаике и Шварца выбирают разные модели, то критерий Акаике выбирает модель более высокого порядка.
Пример
Обратимся теперь к приведенной в разд. 3.1 реализации процесса авторегрессии второго порядка
X
t
= 1.2 X
t–1
– 0.36 X
t–2
+ ε
t
. Используя выборочную коррелограмму, построенную по этой реализации, мы (правильно) идентифицировали порядок этого процесса. Среди AR моделей порядков 4, 3, 2 и 1 оба критерия AIC и SIC также выбрали модель второго порядка. Оценивание модели с ненулевым математическим ожиданием нелинейным методом наименьших квадратов приводит к следующим результатам.
Dependent Variable: X
Sample(adjusted): 3 500
Included observations: 498 after adjusting endpoints
Convergence achieved after 3 iterations
Variable Coef
Std.
Error t-
Statistic
Pro b.
C 0.00 1015 0.330 958 0.003 067 0.9 976
AR(1) 1.25 6580 0.041 257 30.45 723 0.0 000
AR(2) -
0.397095 0.041 290
-
9.617188 0.0 000
Коррелограмма ряда остатков имеет вид
AC
F
PA
CF
A
C
PAC
Q-Stat Prob
.|. |
.|. |
-
0.003
-
0.003 0
.0042
.|. |
.|. |
-
0.005
-
0.005 0
.0165
.|. |
.|. |
0
.000 0
.000 0
.0165 .898
.|. |
.|. |
0
.036 0
.036 0
.6866 .709

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
25
.|. |
.|. |
0
.037 0
.037 1
.3675 .713
*|. |
*|. |
-
0.086
-
0.085 5
.0736 .280
.|. |
.|. |
0
.005 0
.005 5
.0882 .405
.|. |
.|. |
-
0.004
-
0.006 5
.0977 .531
.|. |
.|. |
-
0.002
-
0.004 5
.0993 .648
.|. |
.|. |
0
-
0.054
-
0.050 6
.5887 .582
.|. |
.|. |
1
-
0.014
-
0.008 6
.6897 .669
.|. |
.|. |
2 0
.019 0
.011 6
.8676 .738
Все P-значения для статистики Q
LB
намного больше 0.05, так что гипотеза о том, что в специфицированной модели составляющие ε
t
образуют процесс белого шума, не отвергается. Не отвергается также и гипотеза нормальности ε
t
(P-значение в критерии
Jarque – Bera равно 0.616). Вместе с тем, оценка математического ожидания процесса
X
t
статистически незначима, что позволяет не отвергать гипотезу о нулевом математическом ожидании AR(2) процесса. Оценивая модель с нулевым математическим ожиданием, получаем
Dependent Variable: X
Sample(adjusted): 3 500
Included observations: 498 after adjusting endpoints
Convergence achieved after 2 iterations
Variable Coef
Std.
Error t-
Statistic
Pro b.
AR(1) 1.25 6581 0.041 215 30.48 807 0.0 000
AR(2) -
0.397096 0.041 248
-
9.627056 0.0 000
S.E. of regression
1.03 6707
Akaike info criterion
2.9 1398
Sum squared resid
533.
0816
Schwarz criterion
2.9 3089
Inverted AR
Roots
.63
-.05i
.63+.05i
Исследуем последнюю модель на оптимальность в указанном выше смысле. С этой целью приведем коэффициенты оцененных AR(2), AR(3) и AR(4) моделей и P-
значения для тех коэффициентов двух последних моделей, которые являются
“лишними” с точки зрения “оптимальной” модели AR(2).
Коэффициенты при переменных
Модель
X
t – 1
X
t – 2
X
t – 3
X
t – 4
AR(2)
1.26 –
0.40

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
26
AR(3)
1.25 –
0.39
P =
0.87
AR(4)
1.25 –
0.40
P =
0.72
P =
0.56
Эта таблица показывает, что в моделях с неоправданно высоким порядком
“лишние” коэффициенты оказались статистически незначимыми, а коэффициенты при переменных, включеных в “оптимальную” модель, практически не изменяются при изменении порядка модели. Именно это и характеризует подобранную модель AR(2) как оптимальную.
Интересно, наконец, обратить внимание на еще одно обстоятельство. Как мы уже отмечали ранее, в теоретической модели AR(2), по которой строилась исследуемая нами реализация, уравнение a(z) = 0 , т.е. 1 – 1.2 z + 0.36 z
2
= 0 , имеет двойной корень
z
= 5/3 ≈ 1.67. Этот корень больше единицы, что обеспечивает стационарность процесса, порождаемого такой моделью. В то же время, для оптимальной модели, полученной нами в результате подбора, соответствующее уравнение имеет корни, обратные величинам, указанным в последней строке распечатки результатов оценивания этой модели. Указанные в этой строке величины равны 0.63 ± 0.05i , так что сами корни равны z = 1.58 ± 0.125i . Хотя эти корни, конечно, отличаются от
(двойного) корня уравнения a(z) = 0 в теоретической модели, тем не менее оба они больше единицы по абсолютной величине, а значит, подобранная нами AR(2) модель также является стационарной.

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
1

1 2 3 4 5 6 7 8 9 ... 30