(#)
x
t
= α + β
t + ρ x
t–1
+ (θ
1
∆x
t–1
+ …+ θ
p–1
∆x
t – p+1
) + ε
t
, где
ρ = a
1
+ a
2
+ … + a
p
, θ
j
= – (a
j + 1
+ … + a
p
) .
(В примере с GNP такое преобразование дает
x
t
= 55.017 + 1.304 t + 1.380 X
t–1
– 0.630X
t–1
+ 0.630X
t–1
– 0.630X
t–2
+ ε
t
=
= 55.017 + 1.304 t + 0.750 X
t–1
+ 0.630 ∆X
t–1
+ ε
t
.)
Если исходить из того, что уравнение a(z) = 0 может иметь только один корень z = 1, а остальные p – 1 корней лежат за пределами единичного круга, то тогда наличие единичного корня равносильно тому, что a
1
+ a
2
+ …+ a
p
= 1, т.е. ρ = 1. (См., например, [Hamilton (1994)].) Таким образом, гипотеза существования единичного корня у процесса AR(p) сводится в этом случае к гипотезе H
0
: ρ = 1 в преобразованном соотношении
(#)
. Для проверки этой гипотезы можно пользоваться теми же таблицами Фуллера, только на этот раз используются значения статистики
T(
ρ
ˆ – 1)
и t-отношения для проверки гипотезы ρ = 1, полученные при оценивании
расширенной (augmented)
статистической модели
(#) (
с β и α , равными или не равными нулю). Соответствующие “t-статистики” обозначают обычно
ADF (augmented
Dickey – Fuller)
, в отличие от статистики
DF
, получаемой для модели AR(1).
Для того, чтобы не вычислять самим каждый раз значение t-статистики для гипотезы ρ
= 1, можно преобразовать
(#)
к виду
(
# #)
∆x
t
= α + β
t + φ x
t–1
+ (θ
1
∆x
t–1
+ …+ θ
p-1
∆x
t – p+1
) + ε
t
, где φ = ρ – 1, так что гипотеза H
0
: ρ = 1 в
(#)
равносильна гипотезе H
0
: φ = 0 в (
# #)
В качестве альтернативной к H
0
: ρ = 1 в
(#)
выступает гипотеза H
A
: ρ < 1. При переходе от
(#)
к (
# #))
она преобразуется в гипотезу H
A
: φ < 0 .
При этом, значение “t-статистики” для проверки гипотезы H
0
: ρ = 1 в
(#)
численно равно значению “t-статистики” для проверки гипотезы H
0
: φ = 0 в (
# #)
Пример
Для ряда GNP оценивание модели
∆x
t
= α + β
t + φ x
t–1
+ θ
1
∆x
t–1
+ ε
t
(обычным методом наименьших квадратов) приводит к следующему результату:
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
13
ADF Test Statistic -4.117782 1% Critical Value* -4.1219 5% Critical Value
-3.4875 10% Critical Value
-3.1718
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X)
Variable
Coefficient Std. Error t-Statistic
Prob.
X(-1) -0.249792 0.060662
-4.117782 0.0001
D(X(-1)) 0.630066 0.109453 5.756490 0.0000
C 56.32136 13.18303 4.272264 0.0001
@TREND(1947:1) 1.304300 0.315357 4.135949 0.0001
Гипотеза единичного корня отвергается: значение
t-статистики для проверки гипотезы
H
0
:
φ = 0 оказывается ниже 5% критического значения, вычисленного по формуле
Маккиннона, и близко к 1% критическому значению.
В связи с последним примером, следует особо отметить, что
использование расширенной модели предполагает, что количество запаздывающих разностей, включенных в правую часть, исчерпывает временную зависимость, так что
εt – независимые случайные величины. В то же время, не следует включать в правую часть излишних запаздывающих разностей, т.к. это снижает мощность критериев как по причине оценивания дополнительных параметров, так и по причине уменьшения используемого количества наблюдений.
Для определения надлежащей глубины запаздываний следует начинать с относительно большого порядка
*
pp=
, а затем опираться на то обстоятельство, что хотя при наличии единичного корня распределения оценки
ϕ
ˆ
и
t-статистики для проверки гипотезы
φ = 0 нестандартны, распределения оценок коэффициентов
θ1
, … ,
θp–1 все же являются асимптотически нормальными. Поэтому можно сначала проверить гипотезу о том, что
1
*
−
pθ
= 0, используя обычную
t-статистику и критические точки соответствующего
t-распределения Стьюдента. Если эта гипотеза не отклоняется, то далее проверяем гипотезу
θp*
– 1
=
θp*– 2
= 0, используя
F-критерий и процентные точки
F-распределения Фишера, и.т.д. После этого производится обычная диагностика адекватности подобранной модели.
Пример
Продолжим предыдущий пример. Если взять первоначально
p*
= 5, то получаем:
ADF Test Statistic -2.873575 1% Critical Value* -4.1314 5% Critical Value
-3.4919 10% Critical Value
-3.1744
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X)
Variable
Coefficient Std. Error t-Statistic
Prob.
X(-1) -0.266169 0.092626
-2.873575 0.0060
D(X(-1)) 0.546230 0.133521 4.090958 0.0002
D(X(-2)) 0.183918 0.149711 1.228486 0.2253
D(X(-3)) -0.020254 0.152201
-0.133077 0.8947
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
14
D(X(-4)) -0.058683 0.148061
-0.396345 0.6936
C 59.45556 19.32396 3.076779 0.0035
@TREND(1947:1) 1.397409 0.482120 2.898469 0.0056
Поскольку здесь t = –2.873575 > –3.1744, то гипотеза единичного корня не отвергается даже при выборе 10% уровня значимости. В то же время, статистически незначимыми оказываются коэффициенты при трех последних запаздывающих разностях. P-значение
F-статистики критерия для гипотезы о занулении этих трех коэффициентов равно 0.44.
Поэтому можно обойтись без трех последних запаздывающих разностей, а такую модель мы только что оценивали, и в ней гипотеза единичного корня была отвергнута.
Критерии Дики - Фуллера фактически предполагают, что наблюдаемый ряд описывается моделью авторегрессии конечного порядка (возможно, с поправкой на детерминированный тренд). Как поступать в случае, когда ряд x
t
имеет тип ARMA(p,
q) с q > 0 ?
Пусть x
t
ARMA(p, q) , так что a(L) x
t
= b(L) ε
t
, где a(L), b(L) – полиномы порядков p и q, и пусть оператор b(L) обратим, так что процесс можно представить в виде процесса авторегрессии бесконечного порядка
c(L) x
t
= ε
t
, где
c(L) x
t
= a(L)⁄ b(L) = 1 + с
1
L + с
2
L
2
+ … .
В этом случае представление (
# #)
с конечным числом запаздываний в правой части заменяется бесконечным представлением
(
# # #)
∆x
t
= α + β
t + φ x
t – 1
+ (θ
1
∆x
t – 1
+ θ
2
∆x
t – 2
+ … ) + ε
t
Однако все коэффициенты последнего невозможно оценить по конечному количеству наблюдений. Как выйти из этого положения?
В работе [Said, Dickey (1984)] было показано, что процесс ARIMA(p, 1, q) с неизвестными p и q можно достаточно хорошо аппроксимировать некоторым процессом ARI(p
*
, 1) с p
*
<
3
T .
Это дает возможность ограничиться в правой части
(
# # #)
конечным числом запаздывающих разностей.
6.4. Краткий обзор критериев Дики – Фуллера
Под критерием Дики – Фуллера в действительности понимается группа критериев, объединенных одной идеей, предложенных и изученных в работах [Dickey (1976)],
[Fuller (1976)], [Dickey, Fuller (1979)], [Dickey, Fuller (1981)]. В критериях Дики –
Фуллера проверяемой (нулевой) является гипотеза о том, что исследуемый ряд x
t
принадлежит классу DS (DS-гипотеза); альтернативная гипотеза – исследуемый ряд принадлежит классу TS (TS-гипотеза). Критерий Дики – Фуллера фактически предполагает, что наблюдаемый ряд описывается моделью авторегрессии первого порядка (возможно, с поправкой на линейный тренд). Критические значения зависят от того, какая статистическая модель оценивается и какая вероятностная модель в действительности порождает наблюдаемые значения. При этом рассматриваются следующие три пары моделей (SM – статистическая модель, statistical model; DGP – модель порождения данных, data generating process).
1) Если ряд
t
x имеет детерминированный линейный тренд (наряду с которым может иметь место и стохастический тренд), то в такой ситуации берется пара
SM:
,
,
,
2
,
1
T
t
t
x
x
t
t
t
…
=
+
+
+
=
∆
−
ε
β
α
ϕ
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
15
DGP: .
0
,
,
,
2
,
≠
…
=
+
=
∆
α
ε
α
TtxttВ обоих случаях
εt –
независимые случайные величины, имеющие одинаковое нормальное распределение с нулевым математическим ожиданием. .
Методом наименьших квадратов оцениваются параметры данной SM и вычисляется значение обычной
t-статистики
tϕ
для проверки гипотезы H
0
:
ϕ
= 0. Полученное значение сравнивается с критическим уровнем
tcrit , рассчитанным в предположении, что наблюдаемый ряд в действительности порождается данной моделью DGP
(случайное блуждание со сносом). DS-гипотеза отвергается, если
tϕ
<
tcrit. Критические уровни, соответствующие выбранным уровням значимости, можно взять из таблиц, приведенных в книгах [Fuller (1976)], [Fuller (1996)], если ряд наблюдается на интервалах длины
T = 25, 50, 100, 250, 500. Если количество наблюдений
T другое, то тогда можно вычислить приближенные критические значения, используя формулы, приведенные в работе [MacKinnon (1991)].
2) Если ряд
xt не имеет детерминированного тренда (но может иметь стохастический тренд) и имеет ненулевое математическое ожидание, то берется пара
SM:
,
,
,
2
,
1
Ttxxttt…
=
+
+
=
∆
−
ε
α
ϕ
DGP:
,
,
2
,
Ttxtt…
=
=
∆
ε
Методом наименьших квадратов оцениваются параметры данной SM и вычисляется значение
t-статистики
tϕ
для проверки гипотезы H
0
:
ϕ
= 0. Полученное значение сравнивается с критическим уровнем
tcrit , рассчитанным в предположении, что наблюдаемый ряд в действительности порождается данной моделью DGP (случайное блуждание без сноса). DS-гипотеза отвергается, если
tϕ
<
tcrit . Критические уровни, соответствующие выбранным уровням значимости, можно взять из таблиц, приведенных в книгax [Fuller (1976)], [Fuller (1996)], если ряд наблюдается на интервалах длины
T = 25, 50, 100, 250, 500. Если количество наблюдений
T другое, то тогда можно вычислить приближенные критические значения, используя формулы, приведенные в работе [MacKinnon (1991)].
3) Наконец, если ряд
xt не имеет детерминированного тренда (но может иметь стохастический тренд) и имеет нулевое математическое ожидание, то берется пара
SM:
,
,
,
2
,
1
Ttxxttt…
=
+
=
∆
−
ε
ϕ
DGP:
,
,
2
,
Ttxtt…
=
=
∆
ε
Методом наименьших квадратов оцениваются параметры данной SM и вычисляется значение
t-статистики
tϕ
для проверки гипотезы H
0
:
ϕ
= 0. Полученное значение сравнивается с критическим уровнем
tcrit , рассчитанным в предположении, что наблюдаемый ряд в действительности порождается данной моделью DGP (случайное блуждание без сноса). DS-гипотеза отвергается, если
tϕ
<
tcrit . Критические уровни, соответствующие выбранным уровням значимости, можно взять из таблиц, приведенных в книгах [Fuller (1976)], [Fuller (1996)], если ряд наблюдается на интервалах длины
T = 25, 50, 100, 250, 500. Если количество наблюдений
T другое, то тогда можно вычислить приближенные критические значения, используя формулы, приведенные в работе [MacKinnon (1991)].
Неправильный выбор оцениваемой статистической модели может существенно отразиться на мощности критерия Дики – Фуллера. Например, если наблюдаемый ряд порождается моделью случайного блуждания со сносом, а статистические выводы производятся на основании результатов оценивания статистической модели без включения в ее правую часть трендовой составляющей, то тогда мощность критерия, основанная на статистике
tϕ
, стремится к нулю с возрастанием количества наблюдений
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
16
(см. [Perron (1988)]). С другой стороны, оцениваемая статистическая модель не должна быть и избыточной, поскольку это также ведет к уменьшению мощности критерия.
Формализованная процедура использования критериев Дики – Фуллера с последовательной проверкой возможности редукции статистической модели приведена в работе [Dolado, Jenkinson, Sosvilla – Rivero (1990)]; см. также [Enders (1995)]. Эта процедура будет рассмотрена ниже в разделе 6.6.
Если наблюдаемый ряд описывается моделью авторегрессии a(L) x
t
= ε
t
более высокого (но конечного) порядка p , уравнение a(z) = 0 имеет не более одного единичного корня и не имеет корней внутри единичного круга, то тогда можно воспользоваться расширенным (augmented) критерием Дики – Фуллера. В каждой из трех рассмотренных выше ситуаций достаточно дополнить правые части оцениваемых статистических моделей запаздывающими разностями
∆x
t
−j
, j = 1, …, p
− 1, так что оцениваются расширенные статистические модели
(1) SM:
,
,
,
1
,
1 1
1
T
p
t
x
x
t
x
t
p
j
j
t
j
t
t
…
+
=
+
∆
+
+
+
=
∆
∑
−
=
−
−
ε
θ
ϕ
β
α
(2) SM:
,
,
,
1
,
1 1
1
T
p
t
x
x
x
t
p
j
j
t
j
t
t
…
+
=
+
∆
+
+
=
∆
∑
−
=
−
−
ε
θ
ϕ
α
(3) SM:
,
,
1
,
1 1
1
T
p
t
x
x
x
t
p
j
j
t
j
t
t
…
+
=
+
∆
+
=
∆
∑
−
=
−
−
ε
θ
ϕ
Полученные при оценивании расширенных статистических моделей значения t- статистик t
ϕ
для проверки гипотезы H
0
:
ϕ
= 0 сравниваются с теми же критическими значениями t
crit
, что и для нерасширенных моделей. DS-гипотеза отвергается, если t
ϕ
<
t
crit
Расширенный критерий Дики – Фуллера может применяться и тогда, когда ряд x
t описывается смешанной моделью авторегрессии – скользящего среднего. Как было указано в работе [Said, Dickey (1984)], если ряд наблюдений x
1
,…, x
T
порождается моделью ARIMA(p, 1, q) c q > 0, то его можно аппроксимировать моделью ARI(p
*
, 1) =
ARIMA(p
*
, 1, 0) с p
*
<
3
T
и применять процедуру Дики – Фуллера к этой модели.
Однако даже если ряд наблюдений x
1
,…, x
T
действительно порождается моделью авторегрессии AR(p) конечного порядка p, то значение p обычно не известно, и его приходится оценивать на основании имеющихся наблюдений, а такое предварительное оценивание влияет на характеристики критерия. Поэтому при анализе данных приходится сначала выбирать значение p=p
max достаточно большим, так чтобы оно было не меньше истинного порядка p
0
авторегрессионной модели, описывающей ряд, или порядка р
*
аппроксимирующей авторегрессионной модели, а затем пытаться понизить используемое значение р, апеллируя к наблюдениям.
Такое понижение может осуществляться, например, путем последовательной редукции расширенной модели за счет исключения из нее незначимых (на 10% уровне) запаздывающих разностей (GS-стратегия перехода от общего к частному) или путем сравнения (оцененных) полной и редуцированных моделей с различными р
≤ p
max по информационному критерию Шварца (SIC). В работах [Hall (1994)] и [Ng, Perron
(1995)] показано, что если p
max
≥ p
0
, то тогда в пределе (при Т
→ ∞) SIC выбирает правильный порядок модели, а стратегия GS выбирает модель с р
≥ р
0
; при этом факт определения порядка модели на основании имеющихся данных не влияет на асимптотическое распределение статистики Дики -– Фуллера. Таблицы критических
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
17
значений для конечных значений
T , учитывающие порядок модели, приведены в работе [Cheung, Lay (1995)].
При практической реализации указанных двух подходов (GS и SIC), когда мы имеем лишь ограниченное количество наблюдений, эти две процедуры могут приводить к совершенно различным выводам относительно необходимого количества запаздываний в правой части статистической модели, оцениваемой в рамках расширенного критерия
Дики – Фуллера. Так, при анализе динамики валового внутреннего продукта (GDP)
США по годовым данным на периоде с 1870 по 1994 гг. (см. [Murray, Nelson (2000)]), выбрав
pmax
= 8, авторы получили при использовании GS-стратегии значение
р = 6, тогда как по SIC было выбрано значение
р = 1. В подобных конфликтных ситуациях можно для контроля ориентироваться также на достижение некоррелированности по
LM-критерию остатков от оцененной модели (см. [Holden, Perman (1994)]). Заметим, однако, что в недавней статье [Taylor (2000)] автор приходит в выводам, отличающимся от выводов Ng и Perron: при конечных выборках расширенные критерии Дики – Фуллера очень чувствительны и к форме детерминистских переменных и к принятой структуре запаздываний. Это, в свою очередь, ведет к отклонениям от номинальных уровней значимости критериев Дики – Фуллера.