Глава 8. Процедура Йохансена 8.1. Оценивание ранга коинтеграции Пусть I(1) ряды y 1t , … , y N t в совокупности образуют векторный ряд y t = (y 1t , … , y N t ) T , следующий модели векторной авторегрессииVAR(p) A(L) y t = µ + ε t , где A(L) = A 0 – A 1 L – … – A p L p , A 0 , A 1 , … , A p – матрицы размера (N ×N), A 0 = I N (единичная матрица), т.е. y t = µ + A 1 y t – 1 + … + A p y t – p + ε t . Путем алгебраических преобразований эту модель можно представить также в виде ∆ y t = µ + ζ 0 y t – 1 + ζ 1 ∆y t – 1 … + ζ p – 1 ∆y t – p + 1 + ε t , где ζ 0 = A 1 + … + A p – I N , ζ k = – (A k+1 + … + A p ) , k = 1, 2, … , p – 1. Заметим, что ζ 0 = A 1 + … + A p – I N = – A(1), так что rank ζ 0 = rank A(1). Мы уже отмечали выше (разд.7.4), что если ряды y 1t , … , y N t коинтегрированы, то матрица A(1) имеет пониженный ранг (rank A(1) < N). Этот же пониженный ранг будет иметь в этом случае и матрица ζ 0 . В общем случае, ранг матрицы ζ 0 может принимать значения r = rank ζ 0 = 0, 1, … , N . • Значения r = 1,… , N – 1 соответствуют коинтегрированной VAR (ряды y 1t , … , y N t
I(1) коинтегрированы). • Если r = 0 , то ряды y 1t , … , y N t не коинтегрированы. • Если r = N , то тогда любой N-мерный вектор является коинтегрирующим, так что коинтегрирующими будут, например, векторы (1, 0, … , 0) T , (0, 1, … , 0) T , … , (0, 0, … , 1) T . Но это означает, что все ряды y 1t , … , y N t являются стационарными. Ранг матрицы ζ 0 , r = rank ζ 0 , обычно называют рангом коинтеграции рассматриваемой системы рядов y 1t , … , y N t , вне зависимости от того, имеет ли место действительная коинтеграция этих рядов. Выяснение ранга коинтеграции является ключевым моментом в построении ECM – модели коррекции ошибок – по наблюдаемым статистическим данным. Один из возможных путей решения этой задачи был предложен Йохансеном ([Johansen (1988)], [Johansen (1991)], [Johansen (1992)], [Johansen (1994)], [Johansen, Juselius (1990)]). Изложение этого метода требует перехода к гораздо более высокому математическому уровню. Поэтому мы, не выходя слишком далеко за принятую планку строгости и Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 2 детальности изложения, дадим здесь только самое общее представление об этом методе. Мы уже говорили о том, что если коинтегрированная система I(1) рядов y1 t , … , yN t может быть представлена в форме VAR c rank A(1) = r , то существует соответствующее представление VAR в форме ECM. Исходя из этого, Йохансен в качестве отправной точки берет представление 1 ∆ yt = µ + ζ 0 yt – 1 + ζ 1 ∆ yt – 1 … + ζ p – 1 ∆ yt – p + 1 + εtс матрицей ζ 0 = α βT , где α и β – ( N × r)-матрицы полного ранга r . При этом столбцы β(1) , … , β( r) матрицы β являются линейно независимыми коинтегрирующими векторами, а элементы матрицы α являются коэффициентами при стационарных линейных комбинациях z1, t – 1 = βT(1) yt – 1 , … , zr, t – 1 = βT( r) yt – 1 (представляющих отклонения от r долговременных соотношений между рядами y1 t , … , yN t) в правых частях уравнений для ∆ y1 t , … , ∆ yN tВ процедуре Йохансена предполагается, что εt - N-мерный гауссовский белый шум, так что случайный вектор εt = ( ε1 t , … , εN t) T имеет N -мерное нормальное распределение с нулевым средним и ковариационной матрицей Cov( εt) = Ω , и Cov( εk t , εj s) = 0 при t ≠ s для всех k , j = 1, … , N . Прежде, чем применять процедуру Йохансена, следует определиться с порядком p векторной авторегрессии, которой следует векторный ряд. Для этой цели можно использовать стандартные t- и F-критерии (сасимптотическим N(0, 1) распределением для t-статистики асимптотическими χ2 распределениями для qF) и, применяя их к VAR в уровнях, порядок которой взят “с запасом”, понизить, по возможности, порядок этой “избыточной” VAR . Заметим в этой связи, что процедура Йохансена достаточно чувствительна к выбору порядка VAR , в рамках которой эта процедура реализуется. Сама процедура начинается с того, что по имеющимся наблюдениям значений y1 t , … , yN t , t = 1, … , T , вычисляются максимумы логарифмических функций правдоподобия L(Ω , µ , ζ 0 , ζ 1 , … , ζ p – 1 )для неизвестных параметров Ω , µ , ζ 0 , ζ 1 , … , ζ p – 1 при различных предположениях о ранге коинтеграции r . С точностью до слагаемых, одинаковых при различных r , эти максимумы равны ( ) ( ) , , , 1 , ˆ 1 ln 2 ) ( 1 max NrTrLriiK = − − = ∑ = λ где Nλ λ ˆ , , ˆ 1 K – некоторые величины, вычисляемые на основании одних только статистических данных без всяких предположений о ранге коинтеграции, 1 > 1 ˆ λ > … > Nλ ˆ > 0 . Сравнивая значения Lmax ( r) , полученные при различных r , можно отдать в итоге предпочтение той или иной гипотезе об истинном ранге коинтеграции. Для формализации соответствующего решения в виде некоторой статистической процедуры можно использовать известный из математической статистики критерий отношения правдоподобий для различения двух гипотез. 1 Мы ограничиваемся в этой книге системами I(1) рядов. Йохансен рассматривал также и системы, включающие ряды типа I(2), см. например, [Johansen (1994a)], [Johansen (1994b)], [Johansen (1995b)]. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 3 Пусть в качестве исходной (“нулевой”) выступает гипотеза H 0 : r = r* , а в качестве альтернативной – гипотеза H A : r = r* +1. Для различения этих гипотез сравниваются значения ( ) ( ) ˆ 1 ln 2 ) ( * 1 max ∑ = ∗ − − = riiTrLλ и ( ) ( ) ˆ 1 ln 2 ) 1 ( 1 * 1 max ∑ + = ∗ − − = + riiTrLλ Критерий основывается на статистике λ max ( r* ) = 2 ( Lmax ( r* +1) – Lmax ( r* )) = – ( T/2) ln (1 – 1 * ˆ + rλ ). Асимптотическое (при T → ∞) распределение этой статистики при гипотезе H 0 зависит от r* и N ; для него рассчитаны соответствующие таблицы (см., например, [Patterson (2000), таблицы 14.3 – 14.7], [Enders (1995), таблица B ] или [Hamilton (1994), таблица В.11]). Если гипотеза H 0 : r = r* верна, то значения 1 * ˆ + rλ , … , Nλ ˆ близки к нулю. Если верна альтернативная гипотеза, то значение 1 * ˆ + rλ отделено от нуля, и значения статистики λmax ( r* ) смещаются в сторону больших положительных значений. Поэтому гипотезу H 0 : r = r* следует отвергать в пользу гипотезы H A : r = r* +1 при больших положительных значениях статистики λ max ( r* ), превышающих соответствующий критический уровень. Пусть теперь в качестве исходной (“нулевой”) опять выступает гипотеза H 0 : r = r* , но в качестве альтернативной берется гипотеза H A : r > r* . Для различения этих гипотез сравниваются значения ( ) ( ) ˆ 1 ln 2 ) ( * 1 max ∑ = ∗ − − = riiTrLλ и ( ) ( ) ˆ 1 ln 2 ) ( 1 max ∑ = − − = NiiTNLλ Критерий основывается на статистике λ trace ( r* ) = 2 ( Lmax ( N) – Lmax ( r* )) = ( ) ( ) ˆ 1 ln 2 1 * ∑ + = − − NriiTλ Асимптотическое (при T → ∞) распределение этой статистики при гипотезе H 0 зависит от r* и N ; для него также рассчитаны соответствующие таблицы (см., например, [Patterson (2000), таблицы 14.3 – 14.7], [Enders (1995), таблица B ] или [Hamilton (1994), таблица В.10]). Если гипотеза H 0 : r = r* верна, то значения 1 * ˆ + rλ , … , Nλ ˆ близки к нулю. Если верна альтернативная гипотеза, то эти значения отделены от нуля, и значения статистики λtrace ( r* ) смещаются в сторону больших положительных значений. Поэтому гипотезу H 0 : r = r* следует отвергать в пользу гипотезы H A : r > 1 при больших положительных значениях статистики λ trace ( r* ), превышающих соответствующий критический уровень. Проблема, однако, в том, что заранее обычно не известно, на какое значение r следует рассчитывать. В таком случае возникает целое множество альтернативных пар гипотез, при проверке которых можно получить несогласующиеся результаты. Йохансен предложил последовательную процедуру проверки гипотез, с помощью которой можно получить состоятельную оценку истинного ранга коинтеграции. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 4 Именно, зададимся некоторым уровнем значимости α , скажем, 0.05, и начнем с проверки гипотезы H 0 : r = 0 против альтернативы H A : r > 0. Если эта гипотеза не отвергается, то полагаем 0 ˆ = r. В противном случае проверяем гипотезу H 0 : r = 1 против альтернативы H A : r > 1. Если гипотеза H 0 : r = 1 не отвергается, то полагаем rˆ = 1; в противном случае проверяем гипотезу H 0 : r = 2 против H A : r > 2 и т.д. Полученная оценка rˆ состоятельна в следующем смысле. Если в действительности r = r0 , то при T → ∞P{ rˆ = k } → 0 , k = 0, 1, … , r0 –1, P{ rˆ = r0 } → 1 – α . Таким образом, оценить ранг коинтеграции можно, по крайней мере, теоретически. Однако при обсуждении процедуры Йохансена мы не упомянули еще об одной серьезной проблеме, стоящей на пути к оцениванию истинного ранга коинтеграции. Дело в том, что критические значения статистик критериев отношения правдоподобий зависят не только от r* и N . Они зависят также от того, имеют ли ряды детерминированные тренды, включается ли константа и/или тренд в коинтеграционное соотношение ( коинтеграционное уравнение, CE –cointegrating equation). В связи с этим, при каждом значении r ранга коинтеграции можно рассмотреть следующие 5 ситуаций (именно эти ситуации учитываются, например, в пакете EVIEWS). • H 2 ( r): в данных нет детерминированных трендов; в CE не включаются ни константа ни тренд. • H 1 * ( r): в данных нет детерминированных трендов; в CE включается константа, но не включается тренд. • H 1 ( r): в данных есть детерминированный линейный тренд; в CE включается константа, но не включается тренд. • H * ( r): в данных есть детерминированный линейный тренд; в CE включаются константа и линейный тренд. • H( r): в данных есть детерминированный квадратичный тренд; в CE включаются константа и линейный тренд. При фиксированном ранге r перечисленные 5 ситуаций образуют цепочку вложенных гипотез: H 2 ( r) ⊂ H 1 * ( r) ⊂ H 1 ( r) ⊂ H * ( r) ⊂ H( r) . Это дает возможность, опять используя критерий отношения правдоподобий, проверять выполнение гипотезы, стоящей левее в этой цепочке, в рамках гипотезы, расположенной непосредственно справа. Во всех случаях асимптотическое распределение статистики критерия является распределением хи-квадрат. Что касается степеней свободы у этого асимптотического распределения, то оно равно r –для пар H 2 ( r) ⊂ H 1 * ( r) и H 1 ( r) ⊂ H * ( r), ( N – r) –для пар H 1 * ( r) ⊂ H 1 ( r) и H * ( r) ⊂ H( r) . Заметим, что для каждой из 5 ситуаций, в свою очередь, образуются цепочки вложенных гипотез: H(0) ⊂ … ⊂ H( r) ⊂ … ⊂ H( N) H * (0) ⊂ … ⊂ H * ( r) ⊂ … ⊂ H * ( N) H 1 (0) ⊂ … ⊂ H 1 ( r) ⊂ … ⊂ H 1 ( N) H 1 * (0) ⊂ … ⊂ H 1 * ( r) ⊂ … ⊂ H 1 * ( N) H 2 (0) ⊂ … ⊂ H 2 ( r) ⊂ … ⊂ H 2 ( N) . Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 5 Критические значения статистик λ max и λ trace , используемые при решении вопроса о ранге коинтеграции, различны для этих 5 цепочек, и это осложняет задачу оценивания ранга коинтеграции, поскольку приходится предварительно выбирать цепочку, в рамках которой будет производиться оценивание. Некоторым подспорьем в этом отношении является сводка значений информационных критериев Акаике (AIC) и Шварца для всех упомянутых 5( N +1) вариантов. Как и обычно, наилучшая модель выбирается по минимуму значений критерия Акаике или критерия Шварца. Впрочем, практика показывает, что более доверять в этом отношении стоит критерию Шварца. При анализе смоделированных данных выбор по критерию Акаике часто приводит к результатам, совершенно не соответствующим процессу порождения данных. Для лучшего уяснения возникающих вариантов, рассмотрим 5 ситуаций, перечисленных выше, на простейшем примере треугольной системы Филлипса для двух I(1) рядов. DGP1 : yt = β xt + εt, xt = xt – 1 + νt . На основании этих двух уравнений находим: yt– yt – 1 = – yt – 1 + β ( xt – 1 + νt ) + εt = – ( yt – 1 – β xt – 1 ) + ut, где ut = β νt + εt, так что получаем ECM в виде |