Эконометрика в Excel (часть 2). Ю. Е. Воскобойников
Скачать 1.67 Mb.
|
Глава 4. АВТОРЕГРЕССИОНЫЕ МОДЕЛИ ВРЕМЕННОГО РЯДА 4.1. Определение авторегрессионной модели Ранее, при выделении тренда (см. главу 2), в качестве объяс- няющей переменной (или регрессора) модели временного ряда выступало время τ . Однако в эконометрике достаточно широкое распространение получили регрессионные модели, в которых регрессорами выступают лаговые переменные, влияние которых характеризуется некоторым «запаздыванием». Наиболее часто в качестве такой модели используются авторегрессионные модели вида (1.1.4).Использование авторегрессионных моделей для опи- сания временного ряда основано на предположении о том, что те- кущее значение временного ряда может быть выражено в виде линейной комбинации некоторого количества предыдущих его значений и случайной величины, обладающей свойствами «бело- го» шума. Общий вид моделиавторегрессииp -го порядка (или модель AR(p)) имеет вид 0 1 1 2 2 , 1,2, , i i i p i p i y y y y i n β β β β ε − − − = + + + + + = … , (4.1.1) где 0 1 , ,..., p β β β – коэффициенты модели, i j y − – лаговые перемен- ные, определяющие зависимость значения i y временного ряда в момент i τ от значений в предыдущие моменты времени. Эти ла- говые переменные и выступают в роли регрессоров (объясняю- щих переменных). Возмущения i ε удовлетворяют условиям Га- усса–Маркова: Р1. ( ) 0 i M ε = . (4.1.2) Р2. Корреляционные моменты случайных величин , i j ε ε удов- летворяют условию 2 , ; ( ) 0, i j если i j M если i j σ ε ε ⎧ = = ⎨ ≠ ⎩ (4.1.3) 128 Первая строка означает постоянство дисперсии возмущений i ε , и это свойство называют гомоскедастичностью. Зависимость дис- персии возмущения i ε от номера наблюдения i называется гете- роскедакстичностью. Р3. Случайные величины i ε подчиняются нормальному рас- пределению с нулевым средним и дисперсией 2 σ Для вектора 1 2 n ε ε ε ε = (4.1.4) условия Гаусса–Маркова примут вид: Р1. [ ] 0 n M ε = , (4.1.5) где 0 n – вектор, все n проекций которого равны нулю (т.е. нуле- вой вектор). Р2. 2 , T V M I ε ε ε σ ⎡ ⎤ = = ⎣ ⎦ (4.1.6) где V ε – ковариационная матрица размера n n × ; I – единичная матрица размера n ×n. Напомним, что ,ii -й элемент ковариацион- ной матрицы V ε определяет дисперсию i-й проекции вектора ε , а i, j-й элемент равен корреляционному моменту , i j μ = i j M ε ε ⎡ ⎤ ⋅ ⎣ ⎦ . Если проекции i ε и j ε статистически независимы, то , 0 i j μ = и матрица V ε является диагональной. Р3. Случайный вектор ε подчиняется нормальному распреде- лению 2 (0 , ) n N I σ Наиболее часто используются: • авторегрессионная модель первого порядка (или модель AR(1)): 0 1 1 , 1,2, , i i i y y i n β β ε − = + + = … ; (4.1.7) 129 • авторегрессионная модель второго порядка (или модель AR(2)): 0 1 1 2 2 , 1,2, , i i i i y y y i n β β β ε − − = + + + = … . (4.1.8) Построение модели типа (4.1.1) предполагает решение двух взаимосвязанных задач: определение порядка p авторегрессионной модели вре- менного ряда; оценивание коэффициентов i β Рассмотрим сначала задачу оценивания коэффициентов i β 4.2. Оценивание коэффициентов авторегрессионной модели Так как лаговые переменные по своей сути являются объяс- няющими переменными, то модель (4.1.1) можно рассматривать как линейную множественную регрессию, коэффициенты кото- рой можно оценить на основе классического метода наименьших квадратов, записав для модели (4.1.1) следующее уравнение рег- рессии: 0 1 1 2 2 , 1,2, , i i i p i p y b b y b y b y i n − − − = + + + + = … , (4.2.1) коэффициенты которого являются оценками для 0 1 , ,..., p β β β со- ответственно. Тогда матрица Χ размера ( 1) n p × + , входящая в матричную запись системы нормальных уравнений, имеет вид 0 1 1 1 0 2 2 1 3 1 2 1 1 1 1 p p p n n n p y y y y y y y y y X y y y − − + − + − + − − − = (4.2.2) Для моделей AR(1), AR(2) матрицы Χ содержат элементы: 130 0 1 2 1 1 1 1 1 n y y y y − Χ = ; 0 1 1 0 2 1 1 2 1 1 1 1 n n y y y y y y y y − − − Χ = (4.2.3) Замечание 4.2.1. Начальные значения 0 1 1 , ,..., p y y y − − + , входя- щие в матрицу Χ , как правило, неизвестны, и поэтому их необхо- димо доопределить. Например, 0 y y = – среднее значение наблю- даемых значений, 1 2 1 0 p y y y − − − + = = = = . Этот способ использу- ется в примере 4.2.1. Возможны и другие способы задания этих начальных значений. Например, сдвинуть точку отсчета времен- ного ряда на несколько значений вправо. Так, если 2 p = , то 1 1 0 2 1 3 , , , , n p n y y y y y y y y − − = = = = … , (4.2.4) что позволяет устранить «произвол» в определение начальных значений. ♦ Определив вектор наблюдений y как 1 2 , ,..., T n y y y y = , при- ходим к системе нормальных уравнений: T T X Xb X y = , где вектор 0 1 , ,..., p b b b b = содержит искомые оценки для коэффи- циентов 0 1 , ,..., p β β β авторегрессионной модели. Предполагая, что обратная матрица ( ) 1 T − Χ Χ существует, находим вектор b : ( ) 1 T T b X X X y − = (4.2.5) После этого уравнение регрессии (4.2.1) можно использовать для прогнозирования временного ряда, описываемого авторегрес- сионной моделью. Замечание 4.2.2. Существенным предположением, при кото- ром вектор b является несмещенной и состоятельной оценкой 131 для вектора коэффициентов β является предположение, что мат- рица Х является неслучайной [5, с. 72]. В нашем случае матрица Х (4.2.2) является случайной, так как элементами ее являются случайные величины – лаговые переменные 1 ,..., i i p y y − − . Наруше- ние этого предположения приводит к тому, что вектор b уже не является несмещенной и состоятельной оценкой для вектора β Пример 4.2.1. В табл. 4.1 представлены данные, отражающие динамику курса акций некоторой компании (в условных едини- цах). Таблица 4.1 i 1 2 3 4 5 6 7 i y 971 1166 1044 907 957 727 752 i 8 9 10 11 12 13 14 i y 1019 972 815 823 1112 1386 1428 i 15 16 17 18 19 20 21 i y 1364 1241 1145 1351 1325 1226 1189 Необходимо по этим данным построить модель AR(1), AR(2) и определить их значимость при уровне значимости 0.05 α = , а также построить полиномиальные тренды ( ) t τ первого, второго порядка и проверить их значимость. Построить прогноз для 22, 23 i = Решение. Первоначально, используя команду Добавить ли- нию тренда (см. п. 2.2.1), определим коэффициенты уравнений: линейного тренда ( 1, p = 1 2 m p = + = ) 0 1 ( ) ; t b b τ τ = + (4.2.6) квадратичного тренда ( 2, p = 3 m = ) 2 0 1 2 ( ) t b b b τ τ τ = + + (4.2.7) и вычислим для каждого уравнения тренда значения величин 2 R , 2 R , F по следующим формулам: 132 2 2 1 2 1 ( ) ( ) ( ) 1 1 1 ( ) ( ) ( ) n i i T e i T n i i y y Q y Xb y Xb R Q y y y y y y = = − − − = − = − = − − − − ∑ ∑ ; (4.2.8) 2 2 1 1 (1 ) n R R n m − = − ⋅ − − ; (4.2.9) ( ) ( 1) r e Q n m F Q m ⋅ − = ⋅ − , (4.2.10) где i y – значение, вычисленное по модели временного ряда при i τ τ = , y – вектор размерности n, составленный из средних зна- чений 1 1 n i i y y n = = ∑ , а суммы , e r Q Q определяются выражениями ( ) 2 2 1 ( ) n T T r i i Q b X y n y y y = = − = − ∑ ; 2 1 ( ) n T T T e i i i Q y y b X y y y = = − = − ∑ Значения 2 R , 2 R , F и соответствующие уравнения трендов приведены в табл. 4.2. Таблица 4.2 Уравнение тренда 2 R 2 R F Кван- тиль ( ) 854.66 21.52 t τ τ = + ( 1, p = 2 m = ) 0.379 0.346 11.62 4.38 2 ( ) 943.83 1.74 1.06 t τ τ τ = − + ( 2, p = 3 m = ) 0.406 0.373 12.99 3.55 133 Определим квантиль 0.95; 1; m m n F − − F-распределения по извест- ной формуле: 0.95; 1; FРАСПОБР(0.05; 1; ) m m n F m m n − − = − − при 21 n = . Значение квантиля, играющего роль границы крити- ческой области при проверке гипотезы о значимости построенной регрессии также приведены в табл. 4.2. Из этой табл. видно, что неравенство 0.95; 1; m m n F F − − > (4.2.11) выполняется как для линейного, так и для квадратичного тренда. Поэтому можно сказать, что построенные модели тренда значимы при уровне значимости 0.05. На рис. 4.1 нанесены значения временного ряда i y (отобра- жены маркерами в форме квадратов – кривая 1) и значения квад- ратичного тренда (кривая 2). Видно, что, несмотря на принятие гипотезы о значимости, уравнение тренда не отображает динами- ку рассматриваемого временного ряда, а представляет «усреднен- ную линию» его поведения. Поэтому перейдем к построению ав- торегрессионных моделей для этого временного ряда. Уравнение регрессии для модели AR(1), определенной выра- жением (4.1.7) имеет вид 0 1 1 i i y b b y − = + (4.2.12) Для вычисления коэффициентов 0 1 , b b , которые являются оценка- ми для 0 1 , β β модели (4.1.7) используем классический метод наи- меньших квадратов, реализованный в режиме Регрессия модуля Анализ данных [5, с. 94]. Вычисленные значения: 0 280.90, b = 1 0.746 b = . Значения величин 2 R , 2 R , F приведены в табл. 4.3 (вторая строка). 134 Рис. 4.1. Графики значений , i i y y (пример 4.2.1) Уравнение регрессии для модели AR(2), определенной фор- мулой (4.1.8) имеет вид 0 1 1 2 2 i i i y b b y b y − − = + + (4.2.13) Используя режим Регрессия модуля Анализ данных, вычис- ляем коэффициенты 0 1 2 275.61, 0.730, 0.022 b b b = = = . В табл. 4.3 приведены значения 2 R , 2 R , F для уравнения (4.2.13). Из табл. 4.3 видно: а) уравнения (4.2.12), (4.2.13) имеют существенно большие значения 2 R , 2 R , F по сравнению с квадратичным трендом; б) уравнения (4.2.12), (4.2.13) при вычисленных коэффициен- тах 0 1 2 , , b b b являются значимыми при 0.05 α = и практически имеют одни и те же характеристики. 135 Таблица 4.3 Модель авторегрессии 2 R 2 R F Кван- тиль 1 280.90 0.746 i i y y − = + 0.553 0.528 23.26 4.38 1 2 275.61 0.730 0.022 i i i y y y − − = + + + 0.554 0.525 23.22 3.55 Поэтому, исходя из принципа минимальной сложности, для прогнозирования значений временного ряда будет использоваться уравнение: 1 280.90 0.746 i i y y − = + Для 22 i = прогнозное значение 22 280.90 0.746 1189 1168 y = + ⋅ = Для 23 i = прогнозное значение 23 22 280.90 0.746 280.90 0.746 1168 1152. y y = + = + ⋅ = ☻ 4.3. Оценивание коэффициентов авторегрессионной модели стационарного временного ряда Предположим, что рассматриваемый временной ряд ( ) { } i Y τ представлен выборкой i y , 1, 2,..., i n = . Этот ряд является стацио- нарным с нулевым математическим ожиданием ( ) ( ) 0 i M Y τ = , 1, 2,..., i n = (4.3.1) Если это условие не выполняется, то следует рассмотреть центрированные значения i i z y y = − , 1,2,..., i n = , (4.3.2) где y – оценка (1.2.3) математического ожидания ( ) ( ) i M Y τ 136 Обратимся к уравнению (4.1.1), в котором 0 β следует поло- жить равным 0 (из-за выполнения условия (4.3.1)): 1 1 2 2 i i i p i p i y y y y β β β ε − − − = + + + (4.3.3) Умножим левую и правую части на i m y − и возьмем математиче- ское ожидание от получившихся произведений [ ] [ ] [ ] [ ] [ ] 1 1 2 2 i i m i i m i i m m i m i m i m i M y y M y y M y y M y y M y β β β ε − − − − − − − − = + + + + + + . (4.3.4) Так как случайные величины i ε удовлетворяют условию Гаусса– Маркова, то [ ] 0 i m i M y ε − = , 1,2,... m = (4.3.5) Далее в силу стационарности временного ряда [ ] ( ) i k i m i i m k M y y M y y − − − − ⎡ ⎤ = ⎣ ⎦ . (4.3.6) Обозначим ковариационный момент [ ] k i i k M y y μ − = (4.3.7) и с учетом (4.3.5), (4.3.6), (4.3.7) перепишем (4.3.4) в виде 1 1 2 2 0 m m m m k m k μ β μ β μ β μ β μ − − − = + + + + , 1,2,..., m k = . (4.3.8) Величина [ ] 0 m m M y y μ = есть дисперсия 2 y σ значений временного ряда и поэтому поделив левую и правую части (4.3.8) на 2 0 y σ μ = , получаем систему уравнений в терминах коэффициентов авто- корреляции: ( ) ( ) ( ) ( ) 1 2 1 2 , 1,2,..., . m k m m m m k m p ρ β ρ β ρ β β ρ = − + − + + + + − = (4.3.9) 137 Эта система содержит p уравнений относительно p неизвестных 1 2 , , , p β β β … . Перепишем систему уравнений (4.3.9) в матричном виде β ρ ϒ = , (4.3.10) где ϒ – матрица размера p p × имеет структуру ( ) ( ) ( ) ( ) ( ) 1 1 1 1 1 1 2 1 p p p ρ ρ ρ ρ ρ − ϒ = − − , (4.3.11) а векторы β , ρ состоят из β проекций 1 2 p β β β β = , ( ) ( ) ( ) 1 2 p ρ ρ ρ ρ = (4.3.12) Решая систему (4.3.10), вычисляем вектор β , а следователь- но, коэффициенты β 1 , β 2 , …, β p , входящие в уравнение (4.3.3). К сожалению, на практике коэффициенты автокорреляции ( ) m ρ , m = 1, 2, …, p точно вычислить нельзя и вместо них в мат- рицу ϒ и вектор ρ подставляют выборочные коэффициенты ав- токорреляции ( ) r m , вычисляемые по формуле (1.2.5). В этом слу- чае приходим к системе уравнений Rb r = , (4.3.13) 138 где ( ) ( ) ( ) ( ) ( ) ( ) 1 1 1 1 1 2 1 2 1 r r p r r p R r p r p − − = − − ; ( ) ( ) ( ) 1 2 r r r r p = ; 1 2 p b b b b = . (4.3.14) Эту систему уравнений часто называют уравнениями Юла– Уокера. Проекции 1 2 , , , p b b b … вектора b являются только оценками для коэффициентов β 1 , β 2 , …, β p . Так как выборочные коэффици- енты автокорреляции ( ) r l являются случайными величинами, то матрица R содержит случайные элементы (так же, как и матрица X (4.2.2)) и поэтому вектор b является уже смещенной оценкой для вектора β . Неэффективность оценки b может быть вызвана (при большом значении порядка p ) плохой обусловленностью матрицы R (т.е. матрица R имеет большое число обусловленно- сти). Напомним [5, с. 113], что числом обусловленности квадрат- ной обратимой матрицы R называется величина ( ) 1 cond R R R − = ⋅ , (4.3.15) где евклидова норма матрицы R определяется выражением 1 2 2 , 1 1 p p i j i j R r = = ⎛ ⎞ = ⎜ ⎟ ⎝ ⎠ ∑∑ (4.3.16) Число обусловленности ( ) cond R может изменяться от 1 до + ∞ (вырожденная матрица) и входит в неравенство ( ) b b r r cond R b r − − ≤ , (4.3.17) |