Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
Скачать 3.08 Mb.
|
В этой и в последующих главах мы будем обозначать и случайные величины и их реализации строчными буквами. 6.1. Предварительные замечания Прежде, чем двигаться дальше, следует обратить внимание на одно важное обстоятельство, которое является иногда причиной недоразумений при практическом истолковании полученных результатов. Рассмотрим TS ряд x t = α + β t + a 1 x t – 1 + ε t , | a 1 | < 1. Относительно какого именно линейного тренда этот ряд является стационарным? Пусть y t – детрендированный ряд, так что y t = x t – γ – δ t и y t = a 1 y t – 1 + ε t Подставляя выражения для y t и y t –1 в последнее соотношение, находим: x t – γ – δ t = a 1 (x t –1 – γ – δ (t – 1)) + ε t , x t = (γ – a 1 γ + a 1 δ)+ δ(1– a 1 ) t + a 1 x t –1 + ε t , так что α = γ – a 1 γ + a 1 δ и β = δ(1– a 1 ), откуда получаем δ = β ⁄ (1 – a 1 ), γ = (α – a 1 (α + β)) ⁄ (1 – a 1 ) 2 Таким образом, ряд x t является стационарным относительно линейного тренда t a a a ) (1 ) (1 ) ( 1 2 1 1 − + − + − β β α α В частности, при β = 0 и α ≠ 0 процесс стационарен и имеет математическое ожидание ) (1 1 a − = α µ Если a 1 = 1, то последнее представление невозможно, и надо исходить непосредственно из определения ряда x t . В этом случае x t = α + β t + x t – 1 + ε t = = (α + β t + ε t ) + (α + β( t – 1) + ε t–1 ) + … + (α + β + ε 1 ) + x 0 = = x 0 + (α + β/2) t + (β/2) t 2 + (ε 1 + ε 2 + … + ε t ) . При α = β = 0 имеем простое случайное блуждание x t = x t–1 + ε t , x t = x 0 + (ε 1 + ε 2 + … + ε t ) . При α ≠ 0, β = 0 имеем x t = α + x t–1 + ε t , x t = x 0 + α t + (ε 1 + ε 2 + … + ε t ) , т.е. случайное блуждание вокруг детерминированного линейного тренда x 0 + αt . Наконец, при α ≠ 0, β ≠ 0 x t = α + β t + x t–1 + ε t , x t = x 0 + (α + β/2) t + (β/2) t 2 + (ε 1 + ε 2 + … + ε t ) , так что исходный ряд x t представляет случайное блуждание вокруг детерминированного квадратичного тренда x 0 + (α + β/2) t + (β/2) t 2 Таким образом, в модели x t = α + β t + a 1 x t–1 + ε t если α ≠ 0, β = 0 , то • при | a 1 | < 1 у ряда x t тренда нет; Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 2 • при a 1 = 1 ряд x t имеет стохастический тренд ∑ = t j j 1 ε и линейный тренд x 0 + αt ; если β ≠ 0, то • при | a 1 | < 1 ряд x t имеет линейный тренд t a a a ) (1 ) (1 ) ( 1 2 1 1 − + − + − β β α α ; • при a 1 = 1 ряд x t имеет стохастический тренд ∑ = t j j 1 ε и квадратичный тренд x 0 + ( α + β/2 ) t + ( β/2 ) t 2 Ниже приводятся смоделированные реализации, порожденные моделью x t = α + β t + a 1 x t – 1 + ε t при различных наборах значений параметров α , β , a 1 : • ST_1 : a 1 = 0.8, α = 0, β = 0 • ST_2 : a 1 = 0.8, α = 0.2, β = 0 • ST_3 : a 1 = 0.8, α = 0.16, β = 0.04 . • WALK_1 : a 1 = 1, α = 0, β = 0 . • WALK_2 : a 1 = 1, α = 0.2, β = 0 . • WALK_3 : a 1 = 1, α = 0.2, β = 0.1 . Кроме того, приводится смоделированная реализация, порожденная моделью x t = α + β t + γ t 2 + a 1 x t – 1 + ε t : • ST_4 : a 1 = 0.8, α = 0.12, β = 0.13, γ = 0.01. -6 -4 -2 0 2 4 6 10 20 30 40 50 60 70 80 90 100 ST_1 -4 -2 0 2 4 6 10 20 30 40 50 60 70 80 90 100 ST_2 -10 -8 -6 -4 -2 0 2 4 10 20 30 40 50 60 70 80 90 100 WALK_1 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 3 -5 0 5 10 15 20 25 10 20 30 40 50 60 70 80 90 100 ST_3 -10 -5 0 5 10 15 10 20 30 40 50 60 70 80 90 100 WALK_2 0 100 200 300 400 500 600 10 20 30 40 50 60 70 80 90 100 ST_4 0 100 200 300 400 500 600 10 20 30 40 50 60 70 80 90 100 WALK_3 Сравнение первых трех графиков ST_1, ST_2, WALK_1 между собой и сравнение графиков в парах ST_3 – WALK_2, ST_4 – WALK_3 показывает, сколь трудно различить визуально реализации процессов с единичным корнем от реализаций, соответствующих стационарным или стационарным относительно детерминированного тренда процессов. Перейдем теперь к формальным статистическим критериям наличия (или отсутствия) единичного корня. 6.2. Критерии Дики – Фуллера Мы уже говорили во Введении о том, что при оценивании по статистическим данным статистической модели в форме процесса авторегрессии SM: x t = a 1 x t – 1 + ε t , t = 1, … , T , в случае, когда истинная модель, порождающая данные ( процесс порождения данных, DGP – data generating process) , имеет вид DGP: x t = x t – 1 + ε t , где ε t – гауссовский белый шум, т.е. a 1 = 1, оценка наименьших квадратов 1 ˆa коэффициента a 1 не имеет нормального распределения даже асимптотически. В действительности имеет место следующий факт. При T → ∞ и a 1 = 1 ( ) ( ) { } ∫ − → − 1 0 2 2 1 )] ( [ 1 )] 1 ( [ 2 / 1 1 ˆ dr r W W a n , где W(r) – стандартное броуновское движение с непрерывным временем и сходимость понимается как сходимость распределения случайной величины, стоящей слева, к распределению случайной величины, стоящей справа. Процесс W(r) является непрерывным аналогом дискретного случайного блуждания x t = x t – 1 + ε t Это процесс, для которого Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 4 • W(0) = 0; • Приращения (W(r 2 ) – W(r 1 )),…, (W(r k ) – W(r k–1 )) независимы в совокупности, если 0 ≤ r 1 < r 2 < …< r k ; W(s) – W(r) N(0, s – r) при s > r ; • Реализации W(r) непрерывны с вероятностью 1. Из определения, в частности, следует, что W(1) = W(1) – W(0) N(0, 1), так что [W(1)] 2 χ 2 (1). Отсюда вытекает, что при больших T { } { } { } { } 68 0 1 ) 1 ( 0 1 )] 1 ( [ 0 1 ˆ 1 ˆ 2 2 1 1 = < = < − ≈ < − = < χ P W P a P a P , так что если DGP – простое случайное блуждание (без сноса), DGP: x t = x t – 1 + ε t , то оценивание SM: x t = a 1 x t – 1 + ε t дает значение 1 ˆ 1 < a примерно в 2/3 случаев. Критические значения распределения статистики T( 1 ˆa – 1) при гипотезе a 1 = 1 для конечных T находятся методом статистических испытаний (Монте – Карло); впервые это было сделано Фуллером [Fuller (1976)]. Соответствующие таблицы построены в предположении, что ε t N(0, σ ε 2 ), ε 1 , …, ε T – независимые случайные величины и x 0 = 0. Однако следует заметить, что хотя значение x 0 не влияет на асимптотическое распределение T( 1 ˆa – 1) , оно влияет на распределение T( 1 ˆa – 1) при малых выборках. Критерий, основанный на статистике T( 1 ˆa – 1), отвергает гипотезу H 0 : a 1 = 1 в пользу альтернативной гипотезы H A : a 1 < 1 на 5% уровне значимости при значениях T( 1 ˆa – 1), меньших T( 1 ˆa – 1) крит , или при значениях 1 ˆa , меньших 1 ˆa крит , где T T( 1 ˆa – 1) крит 1 ˆa крит 25 – 7.3 0.708 50 – 7.7 0.846 100 – 7.9 0.921 250 – 8.0 0.968 500 – 8.0 0.998 ∞ – 8.1 Как видно из этой таблицы, при небольших значениях T гипотеза H 0 отвергается лишь для значений 1 ˆa , намного меньших 1. Чувствительность критерия возрастает только при весьма большом количестве наблюдений. Это приводит к тому, что при небольших T отвергнуть гипотезу H 0 : a 1 = 1 в пользу альтернативной гипотезы H A : a 1 < 1 довольно трудно, даже если 1 ˆa существенно меньше 1. Более привычным являлось бы, конечно, использование для проверки гипотезы H 0 : a 1 = 1 против H A : a 1 < 1 отношения ) ˆ ( 1 ˆ 1 1 a s a t − = ( t-отношение , t-ratio, t-статистика ), где s( 1 ˆa ) – оцененная стандартная ошибка оценки 1 ˆa . Однако, поскольку при a 1 = 1 уже и сама оценка 1 ˆa не имеет нормального распределения, то и это отношение не имеет t-распределения Стьюдента. Критические значения этой t-статистики при T → ∞ и некоторых конечных значениях T также впервые были приведены в работе Фуллера [Fuller (1976)]. Гипотеза H 0 : a 1 = 1 отвергается в пользу альтернативной гипотезы H A : a 1 < 1 при больших отрицательных значениях указанной статистики. Сравним 5% критические значения, указанные Фуллером, с 5% критическими значениями обычного одностороннего t-критерия, вычисляемыми по распределению Стьюдента t(T – 1) с (T – 1) степенями свободы: T Фуллер Стьюдент 25 – 1.95 – 1.71 50 – 1.95 – 1.68 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 5 100 – 1.95 – 1.66 250 – 1.95 – 1.65 500 – 1.95 – 1.65 ∞ – 1.95 Таблица иллюстрирует скошенность распределения ( 1 ˆa – 1)/s( 1 ˆa ) при a 1 = 1. В числе прочего, мы приводили в разд. 6.1 смоделированную реализацию процесса случайного блуждания без сноса x t = x t–1 + ε t (WALK_1). Оценим по этой реализации статистическую модель x t = a 1 x t–1 + ε t , используя первые 50 наблюдений: Dependent Variable: WALK_1 Sample(adjusted): 2 50 Included observations: 49 after adjusting endpoints Variable Coeff. Std. Error t-Statistic Prob. WALK_1(-1) 0.970831 0.035729 27.17224 0.0000 Значение указанного выше t-отношения равно (0.970831 – 1)/ 0.035729 = – 0.816 и превышает критическое значение –1.95. Поэтому гипотеза о наличии единичного корня не может быть отвергнута на 5% уровне значимости. Это согласуется с полученной оценкой 0.970831 коэффициента a 1 , значительно превышающей критический уровень 0.846. С другой стороны, если мы возьмем смоделированную в разд. 6.1 реализацию ST_1 стационарного ряда x t = 0.8 x t–1 + ε t (имеющего нулевое математическое ожидание) и оценим по этой реализации статистическую модель x t = a 1 x t–1 + ε t , используя первые 50 наблюдений, то получим: Dependent Variable: ST_1 Method: Least Squares Sample(adjusted): 2 50 Included observations: 49 after adjusting endpoints Convergence achieved after 2 iterations Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.790557 0.090501 8.735349 0.0000 Интересующее нас t-отношение равно – 2.314 < –1.95, что приводит к отвержению гипотезы единичного корня. Это согласуется с тем, что оцененное значение a 1 здесь равно 0.791 и значимо отличается от 1. Обратимся теперь к смоделированной реализации ST_2 стационарного AR(1) процесса x t = 0.2+ 0.8 x t–1 + ε t (математическое ожидание которого равно 1). Среднеарифметическое значение первых 50 значений ряда равно 0.596. Поэтому даже если бы мы не знали, как этот ряд моделировался, мы все же могли сказать, что если этот ряд стационарный, то он имеет скорее ненулевое математическое ожидание. Но тогда альтернативой для гипотезы H 0 : x t = x t–1 + ε t (наличие единичного корня) должна быть гипотеза H A : x t = α + a 1 x t–1 + ε t , a 1 < 1, α ≠ 0. Поэтому в качестве статистической модели мы берем теперь модель SM: x t = α + a 1 x t–1 + ε t Предельное распределение статистики T( 1 ˆa – 1) не только не является нормальным, но и отличается от распределения этой же статистики при оценивании SM с α= 0; при T = 25 P{ 1 ˆa < 1} = 0.95. В следующей таблице приведены критические значения для этого случая: T T( 1 ˆa – 1) крит 1 ˆa крит t крит (Фуллер) 25 – 12.5 0.500 – 3.00 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 6 50 – 13.3 0.734 – 2.92 100 – 13.7 0.863 – 2.89 250 – 14.0 0.944 – 2.88 500 – 14.0 0.972 – 2.87 ∞ – 14.1 – 2.86 Анализ в рамках статистической модели SM: x t = α + a 1 x t–1 + ε t ряда WALK_1 (по первым 50 наблюдениям) дает значение t = – 2.143 > t крит = – 2.92, так что гипотеза о том, что мы имеем дело с реализацией случайного блуждания x t = x t–1 + ε t , не отвергается. Анализ в рамках этой же статистической модели ряда ST_2 дает (при T = 50) значение t = – 2.245 , так что гипотеза единичного корня не отвергается несмотря на то, что моделировалась реализация стационарного процесса. Последнее связано, конечно, с тем, что оцененное значение 1 ˆa = 0.794 выше критического уровня 0.734. Замечание Если мы проанализируем в рамках все той же SM: x t = α + a 1 x t–1 + ε t ряд ST_1 (c α = 0), то получим 1 ˆa = 0.785 > 1 ˆa крит = 0.734, t = – 2.298 > t крит = – 2.92, так что гипотеза единичного корня для ST_1 не отвергается. В то же время, как мы уже видели ранее, если ряд ST_1 анализируется в рамках статистической модели SM: x t = a 1 x t – 1 + ε t , то гипотеза единичного корня отвергается. Этот пример иллюстрирует то обстоятельство, что при добавлении в статистическую модель излишних объясняющих переменных (в т.ч. и константы) мощность критерия снижается, и отвергнуть гипотезу единичного корня становится трудно, даже если она не верна. Поэтому важно выбирать статистическую модель “без излишеств”, включая в нее только такие составляющие, которые соответствуют поведению наблюдаемого временного ряда. Посмотрим теперь на реализацию ST_3 стационарного процесса x t = 0.16+ 0.04 t + 0.8 x t – 1 + ε t , стационарного относительно линейного тренда 0.2 t . Эта реализация похожа на реализацию WALK_2 случайного блуждания со сносом 0.2 x t = 0.2+ x t – 1 + ε t : -5 0 5 10 15 20 25 10 20 30 40 50 60 70 80 90 100 ST_3 -10 -5 0 5 10 15 10 20 30 40 50 60 70 80 90 100 WALK_2 Отсюда возникает проблема различения подобных процессов, и в связи с этим, рассматривается задача проверки гипотезы H 0 : x t = α + x t–1 + ε t , α ≠ 0, (случайное блуждание со сносом) в рамках статистической модели SM: x t = α + β t + a 1 x t–1 + ε t Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 7 Фуллер затабулировал процентные точки распределений оценки 1 ˆa и t-статистики для проверки гипотезы a 1 = 1 в такой ситуации . Если DGP: x t = α + x t–1 + ε t с α ≠ 0, то 5% критические значения статистики T( 1 ˆa – 1) и указанной t-статистики таковы: |