Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
Скачать 3.08 Mb.
|
3.2. Оценивание коэффициентов модели После того как произведена идентификация (стационарной) модели ARMA, т.е. на основании имеющихся наблюдений принято решение о значениях p, q в модели ARMA(p, q), порождающей данные, переходят к этапу оценивания коэффициентов модели. На этом этапе обычно используется метод максимального правдоподобия, который в конечном счете сводится к методу наименьших квадратов. За исключением некоторых наиболее простых случаев (например, модели AR(1)), эта задача решается итерационными методами, требующими задания некоторых “начальных” (“стартовых”) значений параметров, которые затем последовательно уточняются. В качестве таких начальных значений можно использовать предварительные оценки, полученные на первом этапе. Такие начальные значения можно найти, приравнивая неизвестные “истинные” значения автокорреляций ρ(k) значениям r(k) выборочной автокорреляционной функции и используя функциональную связь между значениями ρ(k) и значениями коэффициентов модели. Например, если оценивается модель AR(p), то коэффициенты a 1 , …, a p определяются из системы первых p уравнений Юла – Уокера , , , 1 ), ( ) ( 1 p k j k a k p j j K = − = ∑ = ρ ρ Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 13 в которые вместо неизвестных значений ρ(1), …, ρ(p) автокорреляций подставляются наблюдаемые (вычисляемые по реализации ряда) значения r(1), …, r(p) выборочных автокорреляций. При оценивании моделей с MA(q) составляющей (q > 0) существенным оказывается условие обратимости, сформулированное в разд. 2.5. Покажем это на примере MA(1) модели X t – µ = ε t + bε t–1 , t = 1, … , T . Имея наблюдаемые значения x 1 , x 2 , … , x T , мы последовательно выражаем ε 1 , ε 2 , … , ε T через эти значения и (ненаблюдаемое) значение ε 0 : ε 1 = X 1 – µ – bε 0 , ε 2 = X 2 – µ – bε 1 = X 2 – µ – b(X 1 – µ – bε 0 ) = (X 2 – µ ) – b(X 1 – µ ) + b 2 ε 0 , … ε T = X T – µ – bε T – 1 = (X T – µ ) – b(X T – 1 – µ ) + b 2 (X T – 2 – µ ) – + (–1) T – 1 b T – 1 (X 1 – µ ) + (–1) T b T ε 0 Максимизация (по b) условной функции правдоподобия, соответствующей наблюдаемым значениям x 1 , x 2 , … , x T при фиксированном значении ε 0 , равносильна минимизации суммы квадратов Q (b) = ε 1 2 + ε 2 2 + … + ε T 2 , которая является нелинейной функцией от b . Для поиска минимума этой суммы квадратов приходится использовать численные итерационные методы оптимизации, которые, в свою очередь, требуют задания начального (“стартового”) значения параметра b . Как мы уже говорили, такое стартовое значение может быть получено на этапе идентификации модели. Однако полученное в итоге итераций “оптимальное” значение b зависит от неизвестного нам значения ε 0 , что затрудняет интерпретацию результатов. Задача интерпретации облегчается, если выполнено условие обратимости b < 1, и при этом значение b существенно меньше 1. Действительно, при выполнении этого условия можно просто положить ε 0 = 0 . Эффект от такой замены истинного значения ε 0 на нулевое быстро убывает, так что сумма квадратов, получаемая в предположении ε 0 = 0, может служить хорошей аппроксимацией для суммы, получаемой при истинном значении ε 0 , при достаточно большом количестве наблюдений. Те же аргументы пригодны и для модели MA(q) с q > 1 : в этом случае можно положить ε 0 = ε –1 = … = 1 + − q ε = 0 . Для получения более точной аппроксимации, в пакетах статистических программ (в том числе и в EVIEWS) предусмотрена процедура (backcasting) , в которой процесс итераций включает в себя также и оценивание значений ε 0 , ε –1 , … , 1 + − q ε путем построения для них “обратного прогноза” Если в результате оценивания получена модель, в которой условие обратимости не выполняется, рекомендуется повторить процедуру оценивания с использованием другого набора начальных значений. Более подробное изложение процедур оценивания стационарных ARMA моделей методом максимального правдоподобия можно найти, например, в книге [Hamilton (1994)]. Там же можно прочитать о том, каким образом вычисляются приближения для стандартных ошибок оценок коэффициентов этих моделей, которые можно использовать при большом количестве наблюдений обычным образом. В заключение необходимо только сделать одно важное замечание. Пусть мы имеем стационарную AR(p)модель a (L) X t = δ + ε t Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 14 Мы уже говорили о том, что в этом случае математическое ожидание µ процесса X t связано с константой δ соотношением ) 1 ( 2 1 p a a a − − − − = K δ µ При этом можно сначала оценить коэффициенты a 1 , … , a p и δ , применяя обычный метод наименьших квадратов к модели X t = δ + a 1 X t–1 + a 2 X t–2 + … + a p X t–p + ε t , а затем, используя полученные оценки δ ˆ и ˆ , , ˆ 1 p a a , получить оценку для µ в виде ) ˆ ˆ ˆ 1 ( ˆ ˆ 2 1 p a a a − − − − = K δ µ Однако можно поступить и иначе, как это предусмотрено, например, в пакете EVIEWS (Econometric Views), используемом нами в последующих примерах. Именно, мы можем записать ту же модель в виде X t = µ (1 – a 1 – a 2 – …– a p ) + a 1 X t–1 + a 2 X t–2 + … + a p X t–p + ε t и одновременно оценивать и a 1 , … , a p и µ . Такая процедура теоретически более эффективна. Однако в такой форме модель оказывается нелинейной по параметрам, и это обстоятельство, как и при оценивании MA моделей, требует применения нелинейного метода наименьших квадратов (NLLS – nonlinear least squares) и численных итерационных методов оптимизации. Пример Рассмотрим данные о годовом потреблении рыбных продуктов в США (на душу населения, в фунтах). 946 0.8 956 0.4 947 0.3 957 0.2 948 1.1 958 0.6 949 0.9 959 0.9 950 1.8 960 0.3 951 1.2 961 0.7 952 1.2 962 0.6 953 11.4 963 0.7 954 1.2 964 0.5 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 15 955 0.5 965 0.9 График этого ряда: 10.0 10.5 11.0 11.5 12.0 46 48 50 52 54 56 58 60 62 64 X Коррелограмма, построенная по этим данным, имеет вид Autocorrelati on Partial Correlation A C PAC Q-Stat Prob . |*** . |*** 0 .429 0 .429 4 .2694 0 .039 . |*** . |** 0 .366 0 .222 7 .5350 0 .023 . | . **| . 0 .059 - 0.204 7 .6255 0 .054 . | . . | . 0 .016 - 0.034 7 .6324 0 .106 *| . *| . - 0.156 - 0.129 8 .3498 0 .138 **| . **| . - 0.255 - 0.195 1 0.393 0 .109 ***| . *| . - 0.321 - 0.123 1 3.879 0 .053 . *| . . |* - 0.133 0 .175 1 4.523 0 .069 Ориентируясь на указанные ранее приближенные критерии, прежде всего найдем значение 2/√T = 2/√20 = 0.447. Из полосы ± 0.447 не выходит ни одна из выборочных автокорреляций и частных автокорреляций. Поэтому с точки зрения этих критериев, мы не должны отвергать гипотезу о том, что наблюдаемый ряд порождается моделью MA(0) X 0 = µ + ε t . С другой стороны, если ориентироваться на критерий Люнга – Бокса, то пик ACF на лаге 1 является статистически значимым. Это означает, что в качестве потенциальных моделей порождения данных можно предварительно рассматривать модели AR(1) и MA(1). Таким образом, мы сталкиваемся здесь с конфликтной ситуацией: статистические выводы, получаемые при использовании разных критериев, не соответствуют друг другу. Подобная ситуация не является чем-то исключительным и достаточно часто встречается при идентификации модели, порождающей наблюдаемый ряд, тем более, что используемые критерии – асимптотические, тогда как обычно в распоряжении исследователя имеется не слишком большое количество наблюдений. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 16 Последнее обстоятельство связано в значительной степени с тем, что для многих экономических рядов периоды, на которых порождающая ряд модель может считаться стационарной, обычно непродолжительны из-за изменения общей экономической обстановки, в которой эволюционирует рассматриваемый ряд. Это соображение можно легко проиллюстрировать на примере того же самого ряда данных о потреблении рыбных продуктов в США, если привлечь дополнительно статистические данные за период с 1940 по 1945 годы (годы Второй мировой войны). Эволюция ряда на расширенном периоде с 1940 по 1965 годы представлена следующим графиком: 7 8 9 10 11 12 40 42 44 46 48 50 52 54 56 58 60 62 64 X Провал траектории ряда в 1942 – 1944 г.г. не позволяет трактовать этот ряд как стационарный на всем периоде с 1940 по 1965 годы. Поэтому мы продолжаем далее рассматривать значения ряда только на послевоенном периоде – с 1946 по 1965 г.г. Если остановиться на модели AR(1), то для нее, как мы знаем, ρ(1) = a 1 . Поэтому приравнивая неизвестное значение ρ(1) значению r(1) = 0.429, мы получаем предварительную оценку для неизвестного значения a 1 . В то же время, производя непосредственное оценивание модели AR(1) с ненулевым математическим ожиданием нелинейным методом наименьших квадратов, получаем следующие результаты. Dependent Variable: X Method: Least Squares Sample(adjusted): 1947 1965 Included observations: 19 after adjusting endpoints Convergence achieved after 3 iterations Variable Coef Std. Error t- Statistic Pro b. C 10.8 1451 0.159 261 67.90 445 0.0 000 AR(1) 0.43 0515 0.219 257 1.963 522 0.0 662 R-squared 0.18 4864 Mean dependent var 10. 81053 Adjusted R- squared 0.13 6915 S.D. dependent var 0.4 25434 S.E. of regression 0.39 5238 Akaike info criterion 1.0 80645 Sum squared resid 2.65 5627 Schwarz criterion 1.1 80060 В данной ситуации уточненная оценка практически совпадает с предварительной оценкой для a 1 Если же остановиться на модели MA(1), то в такой модели ρ(1) = b 1 /(1 + b 1 2 ). Приравнивание неизвестного значения ρ(1) значению r(1) = 0.429 приводит к уравнению b 1 /(1 + b 1 2 ) = 0.429. Корни последнего уравнения равны 0.567 и 1.704. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 17 Первый корень соответствует обратимой MA(1) модели; второй корень соответствует необратимой MA(1) модели. Уточненное оценивание MA(1) модели с использованием обратного прогноза (backcasting) дает следующие результаты. Dependent Variable: X Method: Least Squares Sample: 1946 1965 Included observations: 20 Convergence achieved after 13 iterations Backcast: 1945 Variable Coef Std. Error t- Statistic Pro b. C 10.8 1379 0.113 355 95.39 726 0.0 000 MA(1) 0.28 0610 0.228 102 1.230 195 0.2 345 R-squared 0.11 7961 Mean dependent var 10. 81000 Adjusted R- squared 0.06 8959 S.D. dependent var 0.4 14094 S.E. of regression 0.39 9561 Akaike info criterion 1.0 97739 Sum squared resid 2.87 3684 Schwarz criterion 1.1 97313 Log likelihood - 8.977395 F-statistic 2.4 07257 Durbin-Watson stat 1.78 9895 Prob(F-statistic) 0.1 38178 В этом случае уточненное значение коэффицента b 1 существенно отличается от предварительной оценки этого коэффициента. Отметим также большое отличие P- значений для t- и F-статистик в отношении значимости коэффициента b 1 . Это можно объяснить тем, что величина стандартной ошибки вычисляется согласно асимптотической процедуре, тогда как в нашем распоряжении имеется всего лишь 20 наблюдений. Если не производить обратного прогнозирования значения инновации для 1945 года, то результаты получаются близкими: Dependent Variable: X Method: Least Squares Sample: 1946 1965 Included observations: 20 Convergence achieved after 24 iterations Backcast: OFF Variable Coef ficient Std. Error t- Statistic Pro b. C 10.8 1515 0.112 582 96.06 431 0.0 000 MA(1) 0.27 4024 0.229 231 1.195 405 0.2 474 R-squared 0.11 6800 Mean dependent var 10. 81000 Adjusted R- 0.06 S.D. dependent 0.4 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 18 squared 7734 var 14094 S.E. of regression 0.39 9824 Akaike info criterion 1.0 99054 Sum squared resid 2.87 7464 Schwarz criterion 1.1 98628 Log likelihood - 8.990543 F-statistic 2.3 80443 Durbin-Watson stat 1.77 8286 Prob(F-statistic) 0.1 40261 3.3. Диагностика оцененной модели После выбора типа и оценивания коэффициентов модели производится диагностика оцененной модели, т.е. выяснение того, насколько хорошо модель соответствует данным наблюдений (адекватна данным наблюдений) – это является третьим этапом процедуры подбора модели. Для целей диагностики можно использовать целый ряд различных статистических процедур, которые направлены в основном на проверку гипотезы H 0 о том, что в модели, порождающей наблюдения, последовательность ε t действительно образует процесс белого шума. Пусть мы остановили свой выбор на этапе идентификации на модели ARMA(p, q) a (L) X t = b (L) ε t , т.е. X t = a 1 X t–1 + … + a p X t–p + ε t + b 1 ε t–1 + … + b q ε t–q , и на втором этапе оценили ее как t t L b X L a ε ) ( ˆ ) ( ˆ = , где p p L a L a L a ˆ ˆ 1 ) ( ˆ 1 − − − = K , q q L b L b L b ˆ ˆ 1 ) ( ˆ 1 + + + = K Если MA составляющая модели ARMA(p, q) обратима, то тогда ) ( ) ( L b L a t = ε X t , и оценки для ε t теоретически можно получить заменой a(L) и b(L) на ) ( ˆ L a и ) ( ˆ L b , соответственно: t t X L b L a ) ( ˆ ) ( ˆ ˆ = ε На практике, конечно, мы можем использовать эту формулу лишь частично, поскольку бесконечный ряд в правой части приходится обрывать из-за наличия только конечного количества наблюдений. При большом количестве наблюдений поведение t ε ˆ должно имитировать поведение самих ε t . Cледовательно, если ошибки ε t образуют процесс белого шума, то остатки должны имитировать процесс белого шума. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 19 Основываясь на этом соображении, Бартлетт [Bartlett (1946)] и Бокс и Пирс [Box, Pierce (1970)] предложили исследовать статистическую значимость выборочных автокорреляций для ряда инноваций ε t ∑ ∑ = − = + = T t t k T t k t t k r 1 2 1 ˆ ˆ ˆ ) ( ε ε ε ε и суммы их квадратов ) ( 1 2 k r T Q M k BP ∑ = = ε (Q-статистика Бокса – Пирса) Если модель правильно специфицирована, то Q BP имеет распределение, которое близко к распределению χ 2 (M – p – q), при условии, что T и M велики, а отношение (M/T) мало. Гипотеза адекватности подобранной модели отвергается, если Q BP > χ 2 0.95 (M – p – q). Однако впоследствии было замечено, что при конечных T распределение статистики Q BP может существенно отличаться от распределения χ 2 (M – p – q). Используя результаты Люнга и Бокса [Ljung, Box (1978)], можно показать, что ( ) 2 2 ) 5 ( ) ( + + − − − ≈ T M M q p M Q E BP Следовательно, если отношение M(M + 5)/(2T + 2) существенно, то использование χ 2 (M – p – q) приближения не является оправданным. Люнг и Бокс предложили два способа преодоления проблемы смещения. Первый – прямой метод – состоит в использовании приближения Q BP ≈ χ 2 (E(Q BP )) , где для E(Q BP ) используется указанное выше выражение (модифицированный критерий Бокса – Кокса). Второй способ учитывает более точное выражение для D(r ε (k)) – вместо (1/T) берется (T – k)/(T 2 + 2T). Это приводит к Q-статистике Люнга – Бокса ( ) ∑ = − + = M k LB k T r T T Q 1 2 ) 2 ( ε , которая имеет то же асимптотическое распределение χ 2 (M – p – q), что и Q BP , но зато при конечных T распределение статистики Q LB гораздо ближе к χ 2 (M – p – q), чем распределение статистики Q BP . При этом качество приближения ухудшается, если значения параметров находятся вблизи границы стационарности или обратимости модели; особенно это заметно при малых M . Заметим, что хотя первоначально вывод асимптотического распределения статистики Люнга – Бокса производился в предположении, что ε t – гауссовский белый шум, в дальнейшем было установлено, что этот критерий достаточно устойчив к отклонениям распределения ε t от нормального. Важно только, чтобы была конечной дисперсия D(ε t ). ( Последнее условие часто нарушается для рядов, описывающих эволюцию быстро изменяющихся финансовых показателей – цен на акции, биржевых индексов, обменных курсов. Для таких рядов распределение ε t обычно имеет “тяжелые” хвосты , т.е достаточно часто наблюдаются большие по абсолютной величине значения ε t . И это требует привлечения для описания таких рядов более сложных моделей.) Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 20 В пакете EVIEWS в распечатке результатов оценивания моделей ARMA рядом с коррелограммой ряда остатков приводятся P-значения для наблюдаемых значений Q– статистики Люнга – Бокса. Для только что рассмотренных моделей AR(1) и МA(1) коррелограммы рядов остатков имеют следующий вид. Для модели AR(1): A CF P ACF A C PAC Q-Stat Prob *| . *| . - 0.096 - 0.096 0 .2033 . |** . |** 0 .271 0 .265 1 .9334 .164 *| . *| . - 0.116 - 0.078 2 .2687 .322 . |* . | . 0 .076 - 0.008 2 .4232 .489 *| . . | . - 0.099 - 0.049 2 .7024 .609 *| . *| . - 0.125 - 0.175 3 .1852 .671 **| . **| . - 0.257 - 0.260 5 .3801 .496 . | . . | . 0 .019 0 .051 5 .3928 .612 . | . |* 0 .047 0 .189 5 .4826 .705 *| . **| . 0 - 0.178 - 0.259 6 .8945 .648 . | . . | . 1 0 .040 - 0.050 6 .9748 .728 *| . *| . 2 - 0.187 - 0.132 8 .9579 .626 Для модели MA(1): A CF P ACF A C PAC Q-Stat Prob . |* . |* 0 .100 0 .100 0 .2306 . |*** . |*** 0 .365 0 .358 3 .4838 .062 . | . *| . - 0.050 - 0.127 3 .5491 .170 . | . *| . 0 .058 - 0.068 3 .6417 .303 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 21 *| . *| . - 0.139 - 0.088 4 .2051 .379 *| . *| . - 0.169 - 0.182 5 .1071 .403 *| . **| . - 0.277 - 0.199 7 .6991 .261 *| . . |* - 0.066 0 .094 7 .8603 .345 . | . . |* - 0.021 0 .159 7 .8772 .446 *| . **| . 0 - 0.187 - 0.302 9 .4191 .400 . | . . | . 1 0 .002 - 0.042 9 .4192 .493 *| . *| . 2 - 0.187 - 0.104 1 1.338 .415 В обоих случаях все P-значения для статистики Q LB больше 0.05, так что гипотеза о том, что в специфицированных моделях составляющие ε t образуют процесс белого шума, не отвергается. Заметим также, что в обоих случаях не отвергается гипотеза нормальности распределения ε t : P-значения критерия Jarque – Bera равны, соответственно, 0.480 и 0.608. Об оправданности применения последнего критерия при анализе временных рядов будет сказано ниже. Проверка предположения о нормальности Многие статистические процедуры, используемые при анализе временных рядов, опираются на предположение гауссовости (нормальности) анализируемого ряда. Последнее означает, что для любого набора t 1 , …, t n случайные величины n t t X X , , 1 K имеют совместное нормальное распределение. Имея в распоряжении одну единственную реализацию временного ряда, просто невозможно проверить справедливость такого утверждения. В то же время, еще возможно проверить гипотезу о нормальности одномерного (маргинального) распределения стационарного временного ряда. Соответствующая процедура была предложена в работе Ломницкого [Lomnicki (1961)]. Пусть ( ) ∑ = − = T t k t k X X T m 1 1 , 3 , 2 2 4 2 2 / 3 2 3 1 − = = m m G m m G В указанной работе было доказано, что если X t – стационарный гауссовский временной ряд, то при больших T статистики G 1 и G 2 имеют приближенно нормальные распределения с нулевыми математическими ожиданиями и дисперсиями ) ( 24 ) ( , ) ( 6 ) ( 4 2 3 1 k T G D k T G D k k ∑ ∑ ∞ ∞ − = ∞ ∞ − = = = ρ ρ Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 22 Оценить эти дисперсии можно, заменив бесконечные суммы степеней автокорреляций ρ(k) конечными суммами степеней выборочных автокорреляций r(k). Используя такие оценки ), ( ˆ 1 G D ), ( ˆ 2 G D получаем статистики ) ( ˆ , ) ( ˆ 2 2 2 1 1 1 G D G G G D G G = = ∗ ∗ , которые при гипотезе нормальности имеют распределения, аппроксимируемые стандартным нормальным распределением. Поскольку последние статистики еще и асимптотически независимы, то при T → ∞ ( ) ( ) ) 2 ( 2 2 2 2 1 χ ≈ + ∗ ∗ G G Моделирование показывает, однако, что при умеренных значениях T распределениестатистики ∗ 2 G плохо приближается нормальным распределением. Более того, процедура проверки здесь весьма общая (структура временного ряда не специфицируется). Поэтому критерий нормальности, основанный на статистике ( ) ( ) 2 2 2 1 ∗ ∗ + G G , имеет довольно низкую мощность при применении его к моделям AR и MA, т.е. слишком часто не отвергает гипотезу нормальности ряда X t , когда она не верна. Более подходящей является в этом отношении аналогичная процедура, применяемая не к самому ряду X t , а к остаткам, полученным при оценивании специфицированной модели ряда X t . В моделях AR и MA остатки состоятельно оценивают инновации ε t , которые, в предположении нормальности, являются независимыми, одинаково распределенными случайными величинами, имеющими распределение N(0, σ 2 ). Поэтому при применении метода Ломницкого для проверки предположения о нормальности инноваций, мы получаем: , 24 ) ( , 6 ) ( 2 1 T G D T G D = = (т.к. для ряда инноваций ρ(k) = 0 при k ≠ 0), , 24 , 6 2 2 1 1 G T G G T G = = ∗ ∗ так что ( ) ( ) + = + ∗ ∗ 24 6 2 2 2 1 2 2 2 1 G G T G G , а это есть статистика, используемая для проверки нормальности в популярном критерии Jarque – Bera [Jarque, Bera (1980)]. Таким образом, критерий Jarque – Bera можно использовать не только в рамках классической модели регрессии (с фиксированными значениями объясняющих переменных), но и для проверки нормальности инноваций в моделях временных рядов, помня, конечно, о том, что это всего лишь асимптотический критерий. Для улучшения приближения статистики критерия распределением хи-квадрат, в пакете EVIEWS в статистике критерия вместо множителя T используется множитель (T– K), где K – количество коэффициентов, оцениваемых при построении модели исследуемого ряда. Правда, здесь мы не заметили еще одного ”подводного камня”. Мы предполагали неявно, что остатки берутся как результат оценивания правильно идентифицированной модели. Как будет влиять на свойства критерия неправильное определение порядка модели? Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 23 При больших T критерий Шварца достаточно надежно определяет порядок (p, q) модели ARMA, так что проверка нормальности инноваций по модели, выбранной критерием Шварца, асимптотически равносильна проверке нормальности инноваций по правильно идентифицированной модели. На третьем шаге производят также проверку выбранной модели на “оптимальность”, имея в виду, что “более сложные” модели не должны существенно отличаться от подобранной модели. Точнее говоря, при увеличении порядка модели оценки коэффициентов при добавленных составляющих должны быть статистически незначимыми, а оценки коэффициентов при сохраняемых составляющих должны изменяться не очень существенно. Пример Обращаясь опять к результатам оценивания MA(1) и AR(1) моделей для данных о потреблении рыбных продуктов в США, замечаем, что гипотеза H 0 : a 1 = 0 в AR(1) модели и гипотеза H 0 : b 1 = 0 в МA(1) модели не отвергаются. Это означает, что обе эти модели могут быть редуцированы к модели MA(0) X t = µ + ε t Оценивая последнюю, получаем: Variable Coef Std. Error t- Statistic Pro b. C 10.8 1000 0.092 594 116.7 460 0.0 000 R-squared 0.00 0000 Mean dependent var 10. 81000 Adjusted R- squared 0.00 0000 S.D. dependent var 0.4 14094 S.E. of regression 0.41 4094 Akaike info criterion 1.1 23258 Sum squared resid 3.25 8000 Schwarz criterion 1.1 73045 Log likelihood - 10.23258 Durbin-Watson stat 1.1 38735 Но оцененная коррелограмма для этой модели была уже приведена выше, в самом начале рассмотрения данного примера, и именно она дала повод рассматривать в качестве возможных кандидатур модели AR(1) и MA(1). При этом, решая вопрос о статистической значимости ρ(1) и ρ part (1), мы опирались на асимптотические результаты, хотя имели в распоряжении лишь небольшое количество наблюдений, и это может быть причиной несогласованности полученных выводов. Впрочем, мы можем воспользоваться и точным критерием, основанным на статистике Дарбина – Уотсона. Поскольку в последней модели нет никаких объясняющих переменных кроме константы, можно получить таблицы непосредственно для критических значений этой статистики, а не для границ, между которыми заключены эти критические значения. Соответствующие критические значения приведены в работе [Sargan, Bhargava (1983)] . В частности, для уровня значимости 0.05 и T= 21 критическое значение равно 1.069. Ориентируясь на него, мы не отвергаем гипотезу о том, что наблюдаемые данные порождены процессом MA(0). Сравним оцененные модели MA(0), MA(1) и AR(1) по критериям Акаике и Шварца. Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 24 M A(0) M A(1) A R(1) IC 1 .123 1 .098 1 .081 IC 1 .173 1 .197 1 .180 Предпочтительной по критерию Акаике является модель AR(1), тогда как с точки зрения критерия Шварца более предпочтительна модель MA(0). Такое положение в практическом анализе временных рядов возникает достаточно часто: если критерии Акаике и Шварца выбирают разные модели, то критерий Акаике выбирает модель более высокого порядка. Пример Обратимся теперь к приведенной в разд. 3.1 реализации процесса авторегрессии второго порядка X t = 1.2 X t–1 – 0.36 X t–2 + ε t . Используя выборочную коррелограмму, построенную по этой реализации, мы (правильно) идентифицировали порядок этого процесса. Среди AR моделей порядков 4, 3, 2 и 1 оба критерия AIC и SIC также выбрали модель второго порядка. Оценивание модели с ненулевым математическим ожиданием нелинейным методом наименьших квадратов приводит к следующим результатам. Dependent Variable: X Sample(adjusted): 3 500 Included observations: 498 after adjusting endpoints Convergence achieved after 3 iterations Variable Coef Std. Error t- Statistic Pro b. C 0.00 1015 0.330 958 0.003 067 0.9 976 AR(1) 1.25 6580 0.041 257 30.45 723 0.0 000 AR(2) - 0.397095 0.041 290 - 9.617188 0.0 000 Коррелограмма ряда остатков имеет вид AC F PA CF A C PAC Q-Stat Prob .|. | .|. | - 0.003 - 0.003 0 .0042 .|. | .|. | - 0.005 - 0.005 0 .0165 .|. | .|. | 0 .000 0 .000 0 .0165 .898 .|. | .|. | 0 .036 0 .036 0 .6866 .709 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 25 .|. | .|. | 0 .037 0 .037 1 .3675 .713 *|. | *|. | - 0.086 - 0.085 5 .0736 .280 .|. | .|. | 0 .005 0 .005 5 .0882 .405 .|. | .|. | - 0.004 - 0.006 5 .0977 .531 .|. | .|. | - 0.002 - 0.004 5 .0993 .648 .|. | .|. | 0 - 0.054 - 0.050 6 .5887 .582 .|. | .|. | 1 - 0.014 - 0.008 6 .6897 .669 .|. | .|. | 2 0 .019 0 .011 6 .8676 .738 Все P-значения для статистики Q LB намного больше 0.05, так что гипотеза о том, что в специфицированной модели составляющие ε t образуют процесс белого шума, не отвергается. Не отвергается также и гипотеза нормальности ε t (P-значение в критерии Jarque – Bera равно 0.616). Вместе с тем, оценка математического ожидания процесса X t статистически незначима, что позволяет не отвергать гипотезу о нулевом математическом ожидании AR(2) процесса. Оценивая модель с нулевым математическим ожиданием, получаем Dependent Variable: X Sample(adjusted): 3 500 Included observations: 498 after adjusting endpoints Convergence achieved after 2 iterations Variable Coef Std. Error t- Statistic Pro b. AR(1) 1.25 6581 0.041 215 30.48 807 0.0 000 AR(2) - 0.397096 0.041 248 - 9.627056 0.0 000 S.E. of regression 1.03 6707 Akaike info criterion 2.9 1398 Sum squared resid 533. 0816 Schwarz criterion 2.9 3089 Inverted AR Roots .63 -.05i .63+.05i Исследуем последнюю модель на оптимальность в указанном выше смысле. С этой целью приведем коэффициенты оцененных AR(2), AR(3) и AR(4) моделей и P- значения для тех коэффициентов двух последних моделей, которые являются “лишними” с точки зрения “оптимальной” модели AR(2). Коэффициенты при переменных Модель X t – 1 X t – 2 X t – 3 X t – 4 AR(2) 1.26 – 0.40 Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 26 AR(3) 1.25 – 0.39 P = 0.87 AR(4) 1.25 – 0.40 P = 0.72 P = 0.56 Эта таблица показывает, что в моделях с неоправданно высоким порядком “лишние” коэффициенты оказались статистически незначимыми, а коэффициенты при переменных, включеных в “оптимальную” модель, практически не изменяются при изменении порядка модели. Именно это и характеризует подобранную модель AR(2) как оптимальную. Интересно, наконец, обратить внимание на еще одно обстоятельство. Как мы уже отмечали ранее, в теоретической модели AR(2), по которой строилась исследуемая нами реализация, уравнение a(z) = 0 , т.е. 1 – 1.2 z + 0.36 z 2 = 0 , имеет двойной корень z = 5/3 ≈ 1.67. Этот корень больше единицы, что обеспечивает стационарность процесса, порождаемого такой моделью. В то же время, для оптимальной модели, полученной нами в результате подбора, соответствующее уравнение имеет корни, обратные величинам, указанным в последней строке распечатки результатов оценивания этой модели. Указанные в этой строке величины равны 0.63 ± 0.05i , так что сами корни равны z = 1.58 ± 0.125i . Хотя эти корни, конечно, отличаются от (двойного) корня уравнения a(z) = 0 в теоретической модели, тем не менее оба они больше единицы по абсолютной величине, а значит, подобранная нами AR(2) модель также является стационарной. |