Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
Скачать 3.08 Mb.
|
t = x t – 1 + ε 1t , y t = y t – 1 + ε 2t , где ε 1t и ε 2t – последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0, 1), и оценивали статистическую модель SM: y t = α +β x t + ε t При оценивании такой статистической модели по наблюдениям с 51 по 100 мы получили: T β ˆ = 0.598, t β = 7.708, DW = 0.214. При этом график остатков -6 -4 -2 0 2 4 55 60 65 70 75 80 85 90 95 100 RESIDS не похож на график стационарного ряда. Естественно было бы попытаться использовать для выявления такого “неподобающего” поведения остатков не просто визуальное рассмотрение графика остатков, но и формальные статистические критерии, тем более, что критерии проверки интегрированности временных рядов мы уже обсуждали ранее (критерии Дики – Фуллера, Филлипса – Перрона и др.). Дело, однако, в том, что теперь мы имеем дело не с “сырым” рядом, а с рядом остатков, которые вычисляются после предварительного оценивания модели (коэффициентов α и β в последнем примере). Это обстоятельство существенно влияет на распределения соответствующих статистик и не дает возможности пользоваться таблицами, которые мы использовали ранее при анализе на интегрированность сырых рядов. С учетом этого обстоятельства, были построены таблицы, позволяющие производить анализ остатков в случае интегрированных объясняемой и объясняющих переменных, о чем мы поговорим в дальнейшем. Сейчас же только отметим, что дает применение соответствующих таблиц к только что рассмотренному примеру. Пример (продолжение) При оценивании статистической модели SM: y t = α +β x t + ε t по наблюдениям с 51 по 100 мы получили оцененную модель y t = 8.616 +0.598 x t + e t Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 9 С полученным рядом остатков мы поступим так же , как и в случае применения критерия Дики – Фуллера к сырому ряду, т.е. оценим модель ∆ e t = φ e t – 1 + ν t и вычислим t- статистику t φ для проверки гипотезы H 0 : φ = 0, интерпретируя эту гипотезу как гипотезу единичного корня для ряда остатков. Гипотеза H 0 отвергается в пользу гипотезы H A : φ < 0 (интерпретируемой как гипотеза стационарности ряда остатков), если t φ < t крит . Приближенные значения t крит можно найти по формуле t крит ≈ 2 2 1 1 ˆ ˆ − − ∞ + + T T β β β , где 2 1 ˆ , ˆ , ˆ β β β ∞ зависят от выбранного уровня значимости и указаны в статье [MacKinnon (1991)]. Для 5% уровня значимости t крит ≈ – 3.3377 + 5.967 T – 1 – 8.98 T – 2 , что при T = 50 дает t крит = – 3.46 . Последнее значение существенно меньше 5% критического значения статистики Дики – Фуллера – 2.92, рассчитанного для случая сырого ряда. В нашем примере оценивание тестового уравнения Дики – Фуллера дает значение t φ = – 2.01. Последнее существенно выше 5% критического уровня, и гипотеза единичного корня не отвергается. Вообще говоря, вопрос о ложной (паразитной) или неложной (действительной) линейной регрессионной связи между двумя переменными x t и y t , представляющими интегрированные ряды первого порядка (x t , y t I(1)), более точно формулируется следующим образом. Существует ли вообще такое значение β , при котором ряд y t – βx t стационарен? Если ответ на этот вопрос положительный, то говорят что ряды x t и y t (переменные x t и y t ) коинтегрированы . Если же ответ оказывается отрицательным, то ряды x t и y t (переменные x t и y t ) не являются коинтегрированными В последнем случае непосредственное оценивание модели y t = α + β x t + u t бессмысленно, т.к. получаемая оценка T β ˆ , собственно говоря, не является оценкой какого-либо теоретического параметра связи между переменными x t и y t . (См., впрочем, замечание в конце разд. 7.3.) Напротив, если переменные x t и y t коинтегрированы, то T β ˆ является оценкой того единственного значения β , при котором ряд y t – βx t стационарен Заметим теперь, что если в DGP: x t = x t – 1 + ε 1t , y t = y t – 1 + ε 2t допустить коррелированность значений ε 1t и ε 2t в совпадающие моменты времени, т.е. Cov(ε 1t , ε 2t ) ≠ 0, то коррелированность ε 1t и ε 2t вовсе не означает, что ряды x t и y t коинтегрированы. Предположим все же, что существует некоторое значение β , при котором y t = βx t + u t , где u t –стационарный ряд. Тогда y t – 1 – βx t – 1 = u t – 1 , так что ∆y t = β ∆x t + ∆u t , а отсюда ε 2t = β ε 1t + ∆u t . Последнее можно записать в виде u t = u t – 1 + η t , где η t = ε 2t – β ε 1t i.i.d. N(0, σ η 2 ). Но это означает, что u t –нестационарный процесс. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 10 С другой стороны, если x 0 = y 0 = 0, то Cov(x t , y t ) = Cov(ε 11 + … + ε 1t , ε 21 + … + ε 2t ) = t Cov(ε 11 , ε 21 ) , так что x t и y t – коррелированные, но не коинтегрированные случайные блуждания. Существенно, что распределение статистики Дики – Фуллера в подобной ситуации не зависит от конкретного вида матрицы ковариаций Σ = (Cov(ε k 1 , ε s 1 )) , k, s = 1, 2. Тем же свойством обладает и распределение статистики Дарбина – Уотсона, примененной к ряду остатков (CRDW – cointegrating regression DW) : e t = y t – T α ˆ – T β ˆ x t При T = 50 5% критическое значение последней статистики равно 0.78. Гипотеза некоинтегрированности рядов отвергается, если наблюдаемое значение этой статистики превышает критическое значение. В нашем последнем примере значение статистики Дарбина – Уотсона равно 0.214, так что гипотеза некоинтегрированности не отвергается и этим критерием. Что следует делать в случае обнаружения паразитной связи между интегрированными порядка 1 переменными x t и y t ? Имеются три возможных пути обхода возникающих здесь трудностей: 1. Включить в правую часть уравнения запаздывающие значения обеих переменных, точнее, рассмотреть статистическую модель SM: y t = α + β x t + γ y t – 1 + δ x t – 1 + u t , где u t – стационарный ряд и переменная x t трактуется как экзогенная . Последнее уравнение можно записать иначе в следующих двух формах: (a) y t = α + γ y t – 1 + β ∆x t + (β + δ) x t – 1 + u t , (б) y t = α + γ y t – 1 + (β + δ) x t – δ ∆x t + u t В обеих формах слева стоит интегрированная переменная y t I(1). В правой части (а) параметр β является коэффициентом при стационарной переменной ∆x t , имеющей нулевое математическое ожидание; y t – 1 , x t – 1 I(1), u t – стационарный ряд. Как было показано в работе [Sims, Stock, Watson (1990)], в такой ситуации оценки наименьших квадратов для всех коэффициентов SM состоятельны, оценка параметра β асимптотически нормальна. Обычная t- статистика для проверки гипотезы H 0 : β = 0 имеет асимптотически нормальное распределение N(0,1), если u t – белый шум. Аналогично, в правой части (б) параметр – δ является коэффициентом при стационарной переменной ∆x t , имеющей нулевое математическое ожидание; y t –1 , x t I(1), u t – стационарный ряд. Поэтому оценка параметра δ в рамках модели SM асимптотически нормальна, и t- статистика для проверки гипотезы H 0 : δ = 0 имеет асимптотически нормальное распределение N(0,1), если u t – белый шум. Оценки для β и δ остаются асимптотически нормальными и если u t – стационарный ряд, не являющийся белым шумом. Однако при этом асимптотическое распределение N(0,1) имеют Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 11 скорректированные варианты t-статистик, в знаменателях которых стандартные оценки дисперсии ряда u t заменяются состоятельными оценками долговременной дисперсии этого ряда, определенной в разд. 6.8.1. В то же время, статистика qF = 2F для проверки гипотезы H 0 : β = δ = 0 не имеет асимптотического распределения χ 2 (2) , поскольку рассматриваемую SM не удается линейно репараметризовать таким образом, чтобы в правой части преобразованного уравнения и β и δ одновременно стали коэффициентами при стационарных переменных, имеющих нулевые математические ожидания. (У нас они становятся таковыми при разных репараметризациях.) 2. Перед оцениванием модели связи продифференцировать ряды x t и y t , т.е. рассмотреть модель в разностях SM: ∆y t = α + β ∆x t + u t , где u t – стационарный ряд. В этой модели оценки наименьших квадратов и для α и для β асимптотически нормальны. Обе t-статистики имеют асимптотически нормальное распределение N (0,1), если u t – белый шум. Если u t – стационарный ряд, не являющийся белым шумом, то необходимо произвести коррекцию t-статистик, как и в предыдущем пункте. 3. Использовать для оценивания модель регрессии с автокоррелированными остатками SM: y t = α + β x t + u t , u t = ρ x t – 1 + ε t , u t i.i.d. N(0, σ ε 2 ). При этом предпочтительнее оценивать все три параметра α, β, ρ одновременно, используя представление y t – ρ y t – 1 = α(1 – ρ)+ β (x t – ρ x t – 1 )+ ε t В случае ложной регрессии ρ ˆ → 1 (по вероятности), так что, фактически, при больших T этот метод равносилен предварительному дифференцированию рядов. Пример Применим указанные три подхода к анализу реализаций, смоделированных ранее в этом разделе в соответствии с DGP: x t = x t – 1 + ε 1t , y t = y t – 1 + ε 2t , где ε 1t и ε 2t – последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0,1). Для анализа используем последние 50 наблюдений. (1) Применяя первый подход, получаем оцененную модель Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.447271 0.550358 0.812691 0.4206 X -0.014458 0.123861 -0.116725 0.9076 Y(-1) 0.970105 0.055989 17.32664 0.0000 X(-1) 0.033532 0.120061 0.279290 0.7813 Наблюдаемые P-значения для коэффициентов при переменных x t и x t – 1 указывают на то, что переменная x t фактически не объясняет изменчивость переменной y t (2) Применяя второй подход, получаем оцененную модель Dependent Variable: D(Y) Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 12 Variable Coefficient Std. Error t-Statistic Prob. C 0.184523 0.117614 1.568884 0.1232 D(X) -0.033386 0.116361 -0.286915 0.7754 Оба коэффициента статистически незначимы, и это отражает некоррелированность рядов ε 1t и ε 2t (3) Применяя третий подход, оцениваем модель y t – ρ y t – 1 = α(1 – ρ)+ β (x t – ρ x t – 1 )+ ε t , т.е. y t = α * + ρ y t – 1 + β (x t – ρ x t – 1 )+ ε t . При этом получаем: Dependent Variable: Y Method: Least Squares Convergence achieved after 7 iterations Y=C(1)+C(2)*Y(-1)+C(3)*(X-C(2)*X(-1)) Coefficient Std. Error t-Statistic Prob. C(1) 0.217398 0.159423 1.363650 0.1792 C(2) 0.988791 0.035801 27.61920 0.0000 C(3) -0.027306 0.119276 -0.228934 0.8199 R-squared 0.940380 Mean dependent var 3.404232 Как и ожидалось, коэффициент при y t – 1 оказался очень близким к 1, а два других коэффициента статистически незначимы. Проверка на одновременное зануление этих двух коэффициентов дает P-значение 0.367. Пример Изменим процесс порождения данных, оставляя те же формулы для x t и y t , т.е. x t = x t – 1 + ε 1t , y t = y t – 1 + ε 2t , но теперь пусть ε 1t – последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25), ε 2t – последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25), Cov (ε 1t , ε 2s ) = 0 для t ≠ s , Cov(ε 1t , ε 2t ) = 1. Отсюда, в частности, следует, что Corr(ε 1t , ε 2t ) = 0.8 . Смоделированные реализации ε 1t и ε 2t имеют вид Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 13 -3 -2 -1 0 1 2 3 10 20 30 40 50 60 70 80 90 100 NOISE_X NOISE_Y Траектории смоделированной пары рядов ε 1t и ε 2t ведут себя достаточно согласованным образом; оцененный коэффициент корреляции между этими рядам равен 0.789. Полученные при этом реализации рядов x t и y t ведут себя, как показано ниже на правом рисунке. Для сравнения на левом рисунке показано поведение реализаций рядов ε 1t и ε 2t при их полной статистической независимости. -20 -15 -10 -5 0 5 10 10 20 30 40 50 60 70 80 90 100 X Y -20 -15 -10 -5 0 5 10 10 20 30 40 50 60 70 80 90 100 X Y Для сопоставимости с ранее полученными результатами, опять обратимся ко второй части отрезка наблюдений; здесь оцененный коэффициент корреляции между рядами ε 1t и ε 2t равен 0.792. Сначала оценим модель y t = α + β x t + u t . В результате получаем для ряда остатков значение статистики Дики – Фуллера, равное –2.112, которое выше 5% критического уровня –3.46. Соответственно, гипотеза о ложности регрессионной связи не отвергается. (1) Применяя первый подход, получаем оцененную модель Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. C 0.548392 0.377080 1.454312 0.1526 X 0.718479 0.079943 8.987361 0.0000 Y(-1) 0.913556 0.067811 13.47210 0.0000 X(-1) -0.641522 0.088805 -7.223976 0.0000 R-squared 0.987574 Mean dependent var -0.957402 По сравнению с ранее рассмотренным случаем, в котором ряды ε 1t и ε 2t были между собой статистически не связанными, теперь оказываются статистически значимыми и Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 14 коэффициенты при переменных x t и x t – 1 . Исключая из правой части модели константу, получаем: Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob. X 0.695862 0.079341 8.770553 0.0000 Y(-1) 1.005257 0.025245 39.82053 0.0000 X(-1) -0.707002 0.077447 -9.128837 0.0000 R-squared 0.987003 Mean dependent var -0.957402 т.е. y t = 1.005 y t – 1 + 0.695 x t – 0.707 x t – 1 + e t . Оценка коэффициента при y t – 1 близка к 1; оцененные коэффициенты при x t и x t – 1 близки по абсолютной величине и противоположны по знаку, что вполне согласуется с реализованной моделью DGP. (2) Применяя второй подход, получаем оцененную модель Dependent Variable: D(Y) Variable Coefficient Std. Error t-Statistic Prob. C 0.100915 0.083851 1.203508 0.2347 D(X) 0.694000 0.077274 8.981039 0.0000 R-squared 0.626921 Mean dependent var 0.226857 И здесь, в отличие от ранее использовавшегося DGP, становится значимым коэффициент при переменной ∆x t , что отражает коррелированность случайных величин ε 1t и ε 2t , т.е. коррелированность ∆x t и ∆y t . Исключая из правой части уравнения статистически незначимую константу, получаем: Dependent Variable: D(Y) Variable Coefficient Std. Error t-Statistic Prob. D(X) 0.709553 0.076533 9.271155 0.0000 т.е. ∆y t = 0.710 ∆x t + e t , или y t = y t – 1 + 0.710 x t – 0.710 x t – 1 + e t (3) Наконец, применяя третий подход, оцениваем модель y t = α * + ρ y t – 1 + β (x t – ρ x t – 1 )+ ε t ; при этом получаем: Dependent Variable: Y Convergence achieved after 8 iterations Y=C(1)+C(2)*Y(-1)+C(3)*(X-C(2)*X(-1)) Coefficient Std. Error t-Statistic Prob. C(1) 0.329205 0.250398 1.314726 0.1950 C(2) 0.941984 0.056946 16.54170 0.0000 C(3) 0.723593 0.079341 9.119982 0.0000 R-squared 0.987410 Mean dependent var -0.957402 Здесь становится статистически значимым коэффициент β . Исключение из правой части константы дает: Dependent Variable: Y Convergence achieved after 4 iterations Y=C(2)*Y(-1)+C(3)*(X-C(2)*X(-1)) Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 15 Coefficient Std. Error t-Statistic Prob. C(2) 1.014411 0.020750 48.88608 0.0000 C(3) 0.702102 0.078268 8.970448 0.0000 т.е. y t = 1.014 y t – 1 + 0.702(x t – 1.014 x t – 1 )+ e t , или y t = 1.014 y t – 1 + 0.702 x t – 0.712 x t – 1 + e t Отметим близость результатов, полученных тремя методами: y t = 1.005 y t – 1 + 0.695 x t – 0.707 x t – 1 + e t (метод 1), y t = y t – 1 + 0.710 x t – 0.710 x t – 1 + e t (метод 2), y t = 1.014 y t – 1 + 0.702 x t – 0.712 x t – 1 + e t (метод 3). Фактически, во всех трех случаях воспроизводится одна и та же линейная модель связи между рядами разностей: ∆y t = 0.7 ∆x t + e t Эта регрессионная связь между продифференцированными рядами не является ложной (в отличие от регрессионной связи между рядами уровней): статистика Дарбина – Уотсона принимает значение 1.985; P-значение критерия Jarque – Bera равно 0.344. Замечание В связи с результатами, полученными при рассмотрении последних примеров, естественно возникает следующий вопрос, который поднимался в свое время различными исследователями. Не будет ли разумным, имея дело с рядами, траектории которых обнаруживают выраженный тренд, сразу приступать к оцениванию связей между рядами разностей (между продифференцированными рядами) ? Против некритичного использования такого подхода говорят два обстоятельства: (a) Если ряды в действительности стационарны относительно детерминированного тренда, то тогда дифференцирование приводит к |