Глава 2. Стационарные ряды. Модели ARMA 2.1. Общие понятия. Под временным рядом (time series) понимается последовательность наблюдений значений некоторой переменной, произведенных через равные промежутки времени. Если принять длину такого промежутка за единицу времени (год, квартал, день и т.п.), то можно считать, что последовательные наблюдения x 1 , ..., x n произведены в моменты t = 1, …, n . Основная отличительная особенность статистического анализа временных рядов состоит в том, что последовательность наблюдений x 1 , ..., x n рассматривается как реализация последовательности, вообще говоря, статистически зависимых случайных величин X 1 , ..., X n , имеющих некоторое совместное распределение с функцией распределения F(v 1 , v 2 , …, v n ) = P{ X 1 < v 1 , X 2 < v 2 , ... , X n < v n }. Мы будем рассматривать в основном временные ряды, у которых совместное распределение случайных величин X 1 , ..., X n имеет совместную плотность распределения p( x 1 , x 2 , … , x n ). Чтобы сделать задачу статистического анализа временных рядов доступной для практического решения, приходится так или иначе ограничивать класс рассматриваемых моделей временных рядов, вводя те или иные предположения относительно структуры ряда и структуры его вероятностных характеристик. Одно из таких ограничений предполагает стационарность временного ряда. Ряд x t , t = 1, …, n , называется строго стационарным (или стационарным в узком смысле), если для любого m ( m < n)совместное распределение вероятностей случайных величин m t t X X , , 1 K такое же, как и для τ τ , , 1 + + m t t X X K , при любых t 1 ,…, t m и τ , таких, что 1 ≤ t 1 , … , t m ≤ n и 1 ≤ t 1 + τ , … , t m + τ ≤ n. Другими словами, свойства строго стационарного временного ряда не изменяются при изменении начала отсчета времени. В частности, при m = 1 из предположения о строгой стационарности временного ряда x t следует, что закон распределения вероятностей случайной величины X t не зависит от t, а значит, не зависят от t и все его основные числовые характеристики (если, конечно, они существуют), в том числе: математическое ожидание E (X t ) = µ и дисперсия D(X t )= σ 2 Значение µ определяет постоянный уровень, относительно которого колеблется анализируемый временной ряд x t , а постоянная σ характеризует размах этих колебаний. Как мы уже говорили, одно из главных отличий последовательности наблюдений, образующих временной ряд, заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависимыми. Степень тесноты статистической связи между случайными величинами X t и X t+ τ может быть измерена парным коэффициентом корреляции Corr(X t , X t + τ ) = ( ) ( ) τ τ ) , ( + + t t t t X D X D X X Cov , где Cov(X t , X t + τ ) = E [(X t −E(X t ))(X t + τ −E(X t+ τ ))] .
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 2 Если ряд x t стационарный, то значение Cov(X t , X t+ τ ) не зависит от t и является функцией только от τ ; мы будем использовать для него обозначение γ ( τ ) : γ ( τ )= Cov(X t , X t + τ ) . В частности, D(X t ) = Cov(X t , X t ) ≡ γ (0) . Соответственно, для стационарного ряда и значение коэффициента корреляции Corr(X t , X t + τ ) зависит только от τ ; мы будем использовать для него обозначение ρ( τ ), так что ρ( τ ) = Corr(X t , X t + τ ) = γ ( τ )⁄ γ (0) . В частности, ρ(0) = 1. Практическая проверка строгой стационарности ряда x t на основании наблюдения значений x 1 , x 2 , …, x n в общем случае затруднительна. В связи с этим под стационарным рядом на практике часто подразумевают временной ряд x t , у которого • E(X t ) ≡ µ , • D(X t ) ≡ σ 2 , • Cov(X t , X t + τ ) = γ ( τ ) для любых t и τ Ряд, для которого выполнены указанные три условия, называют стационарным в широком смысле (слабо стационарным, стационарным второго порядка или ковариационно стационарным). Если ряд является стационарным в широком смысле, то он не обязательно является строго стационарным. В то же время, и строго стационарный ряд может не быть стационарным в широком смысле просто потому, что у него могут не существовать математическое ожидание и/или дисперсия. (В отношении последнего примером может служить случайная выборка из распределения Коши.) Кроме того, возможны ситуации, когда указанные три условия выполняются, но, например, E( 3 t X ) зависит от t . Ряд x t , t = 1, …, n, называется гауссовским, если совместное распределение случайных величин X 1 , ... , X n является n-мерным нормальным распределением. Для гауссовского ряда понятия стационарности в узком и в широком смысле совпадают. В дальнейшем, говоря о стационарности некоторого ряда x t , мы (если не оговаривается противное) будем иметь в виду, что этот ряд стационарен в широком смысле (так что у него существуют математическое ожидание и дисперсия). Итак, пусть x t – стационарный ряд с E(X t ) ≡ µ , D(X t ) ≡ σ 2 и ρ( τ ) = Corr(X t , X t+ τ ). Поскольку в данном случае коэффициент ρ( τ ) измеряет корреляцию между членами одного и того же временного ряда, его принято называть коэффициентом автокорреляции (или просто автокорреляцией). По той же причине о ковариациях γ ( τ )= Cov(X t , X t + τ ) говорят как об автоковариациях.При анализе изменения величины ρ( τ ) в зависимости от значения τ принято говорить об автокорреляционной функции ρ( ττττ ). Автокорреляционная функция безразмерна, т.е. не зависит от масштаба измерения анализируемого временного ряда. Ее значения могут изменяться в пределах от −1 до +1; при этом ρ(0) = 1. Кроме того, из стационарности ряда x t следует, что ρ( τ ) = ρ( − τ ), так что при анализе поведения автокорреляционных функций обычно ограничиваются рассмотрением только неотрицательных значений τ График зависимости ρ( τ ) от τ частоназывают коррелограммой. Он может использоваться для характеризации некоторых свойств механизма, порождающего временной ряд. Для дальнейшего заметим, что если x t – стационарный временной ряд и
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 3 c – некоторая постоянная, то временные ряды x t и (x t + c) имеют одинаковые коррелограммы. Если предположить, что временной ряд описывается моделью стационарного гауссовского процесса, то полное описание совместного распределения случайных величин X 1 , ..., X n требует задания n+1 параметров: µ , γ (0), γ (1), …, γ (n −1) (или µ , γ (0), ρ(1), …, ρ(n −1)). Это намного меньше, чем без требования стационарности, но все же больше, чем количество наблюдений. В связи с этим, даже для стационарных гауссовских временных рядов приходится производить дальнейшее упрощение модели с тем, чтобы ограничить количество параметров, подлежащих оцениванию по имеющимся наблюдениям. Мы переходим теперь к рассмотрению некоторых простых по структуре временных рядов, которые, в то же время, полезны для описания эволюции во времени многих реальных экономических показателей. 2.2. Процесс белого шума Процессом белого шума (“белым шумом”, “чисто случайным временным рядом”) называют стационарный временной ряд x t , для которого E(X t ) ≡ 0, D(X t ) ≡ σ 2 > 0 и ρ( τ ) =0 при τ ≠ 0. Последнее означает, что при t ≠ s случайные величины X t и X s , соответствующие наблюдениям процесса белого шума в моменты t и s, некоррелированы. В случае, когда X t имеет нормальное распределение, случайные величины X 1 , ..., X n взаимно независимы и имеют одинаковое нормальное распределение N(0, σ 2 ), образуя случайную выборку из этого распределения, т.е. X t i.i.d. N(0, σ 2 ). Такой ряд называют гауссовским белым шумом. В то же время, в общем случае, даже если некоторые случайные величины X 1 , ... , X n взаимно независимы и имеют одинаковое распределение, то это еще не означает, что они образуют процесс белого шума, т.к. случайная величина X t может просто не иметь математического ожидания и/или дисперсии (в качестве примера мы опять можем указать на распределение Коши). Временной ряд, соответствующий процессу белого шума, ведет себя крайне нерегулярным образом из-за некоррелированности при t ≠ s случайных величин X t и X s . Это иллюстрирует приводимый ниже график смоделированной реализации гауссовского процесса белого шума (NOISE) с D(X t ) ≡ 0.04. -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 50 100 150 200 250 300 350 400 450 NOISE
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 4 В связи с этим процесс белого шума не годится для непосредственного моделирования эволюции большинства временных рядов, встречающихся в экономике. В то же время, как мы увидим ниже, такой процесс является базой для построения более реалистичных моделей временных рядов, порождающих “более гладкие” траектории ряда. В связи с частым использованием процесса белого шума в дальнейшем изложении, мы будем отличать этот процесс от других моделей временных рядов, используя для него обозначение ε t В качестве примера ряда, траектория которого похожа на реализацию процесса белого шума, можно указать, например, на ряд, образованный значениями темпов изменения (прироста) индекса Доу-Джонса в течение 1984 года (дневные данные). График этого ряда имеет вид -3 -2 -1 0 1 2 3 4 50 100 150 200 250 DOW-JONES_TEMP Заметим, однако, что здесь наблюдается некоторая асимметрия распределения вероятностей значений x t (скошенность этого распределения в сторону положительных значений), что исключает описание модели этого ряда как гауссовского белого шума. 2.3. Процесс авторегрессии Одной из широко используемых моделей временных рядов является процесс авторегрессии (модель авторегрессии). В своей простейшей форме модель авторегрессии описывает механизм порождения ряда следующим образом: X t = a X t – 1 + ε t , t = 1, …, n, где ε t – процесс белого шума, имеющий нулевое математическое ожидание и дисперсию σ ε 2 , X 0 – некоторая случайная величина, а a ≠ 0 – некоторый постоянный коэффициент. При этом E(X t ) = a E(X t – 1 ), так что рассматриваемый процесс может быть стационарным только если E(X t ) = 0 для всех t = 0,1, …, n. Далее, X t = a X t – 1 + ε t = a (a X t –2 + ε t–1 ) + ε t = a 2 X t–2 + a ε t–1 + ε t = … = = a t X 0 + a t –1 ε 1 + a t–2 ε 2 + … + ε t , X t–1 = a X t–2 + ε t–1 = a t–1 X 0 + a t–2 ε 1 + a t–3 ε 2 + … + ε t–1 , X t–2 = a X t–3 + ε t–2 = a t–2 X 0 + a t–3 ε 1 + a t–4 ε 2 + … + ε t–2, … X 1 = a X 0 + ε 1
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 5 Если случайная величина X 0 не коррелирована со случайными величинами ε 1 , ε 2 , …, ε n , то отсюда следует, что Cov(X 0 , ε 1 ) = 0, Cov(X 1 , ε 2 ) = 0, … , Cov(X t–2 , ε t–1 ) = 0, Cov(X t–1 , ε t ) = 0 и D(X t ) = D(aX t–1 + ε t ) = a 2 D(X t–1 ) + D(ε t ), t = 1, …, n. Предполагая, наконец, что D(X 0 ) = D(X t ) = σ X 2 для всех t = 1, …, n, находим: σ X 2 = a 2 σ X 2 + σ ε 2 Последнее может выполняться только при выполнении условия a 2 < 1, т.е. a < 1. При этом получаем выражение для σ X 2 σ X 2 = σ ε 2 ⁄ (1– a 2 ) . Что касается автоковариаций и автокорреляций, то Cov(X t , X t + τ ) = Cov(a t X 0 + a t–1 ε 1 + a t–2 ε 2 + … + ε t , a t+τ X 0 + a t+τ–1 ε 1 + a t+τ–2 ε 2 + … + ε t+τ ) = = a 2t+τ D(X 0 ) + a τ (1 + a 2 + … + a 2(t–1) ) σ ε 2 = = a τ [a 2t σ ε 2 ⁄ (1– a 2 ) + (1– a 2t ) σ ε 2 ⁄ (1– a 2 )] = [a τ ⁄ (1– a 2 )] σ ε 2 , и Corr(X t , X t + τ ) = a τ , т.е. при сделанных предположениях автоковариации и автокорреляции зависят только от того, насколько разнесены по времени соответствующие наблюдения. Таким образом, механизм порождения последовательных наблюдений, заданный соотношениями X t = a X t–1 + ε t , t = 1, …, n, порождает стационарный временной ряд, если • a < 1 ; • случайная величина X 0 не коррелирована со случайными величинами ε 1 , ε 2 , …, ε n ; • E(X 0 ) = 0 ; • D(X 0 ) = σ ε 2 ⁄ (1– a 2 ) . При этом Corr(X t , X t + τ ) = ρ( τ ) = a τ Рассмотренная модель порождает (при указанных условиях) стационарный ряд, имеющий нулевое математическое ожидание. Однако ее можно легко распространить и на временные ряды y t с ненулевым математическим ожиданием E(Y t ) = µ , полагая, что указанная модель относится к центрированному ряду X t = Y t – µ : Y t – µ = a (Y t–1 – µ ) + ε t , t = 1, …, n, так что Y t = aY t–1 + δ + ε t , t = 1, …, n, где δ = µ (1– a) . Поэтому без ограничения общности можно обойтись в текущем рассмотрении моделями авторегрессии, порождающими стационарный процесс с нулевым средним.
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 6 Продолжая рассмотрение для ранее определенного процесса Xt (с нулевым математическим ожиданием), заметим, что для него γ (1) = E( Xt ·Xt–1 ) = E [( a Xt–1 + εt) ·Xt–1 ] = aγ (0), так что ρ(1) = γ (1) ⁄ γ (0) = a , и при значениях a > 0, близких к 1, между соседними наблюдениями имеется сильная положительная корреляция, что обеспечивает более гладкий характер поведения траекторий ряда по сравнению с процессом белого шума. При a < 0 процесс авторегрессии, напротив, имеет менее гладкие реализации, поскольку в этом случае проявляется тенденция чередования знаков последовательных наблюдений. Следующие два графика демонстрируют поведение смоделированных реализаций временных рядов, порожденных моделями авторегрессии Xt = a Xt–1 + εt с σ ε2 = 0.2 при a = 0.8 (первый график) и a = – 0.8 (второй график). -1.0 -0.5 0.0 0.5 1.0 1.5 50 100 150 200 250 300 350 400 450 a = 0.8 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 50 100 150 200 250 300 350 400 450 a = - 0.8 Теперь мы должны обратить внимание на следующее важное обстоятельство. В практических ситуациях “стартовое” значение X0 = x0 , на основе которого в соответствии с соотношением Xt = a Xt–1 + εt строятся последующие значения ряда Xt, может относиться к концу предыдущего периода, на котором просто в силу других экономических условий эволюция соответствующего экономического показателя следует иной модели, например, модели Xt = a Xt–1 + εt с другими значениями a и σ ε2 Более того, статистические данные о поведении ряда до момента t = 0 могут отсутствовать вовсе, так что значение x0 является просто некоторой наблюдаемой числовой величиной. В обоих случаях ряд Xt уже не будет стационарным даже при a < 1. Рассмотрим подробнее характеристики и поведение ряда в таких ситуациях. Если не конкретизировать модель, в соответствии с которой порождались наблюдения до момента t = 1, то значение x0 можно рассматривать как фиксированное. При этом Xt = a t x0 + a t–1 ε1 + a t–2 ε2 + … + εt , E( Xt) = a t x0 + a t–1 E( ε1 ) + a t–2 E( ε2 ) + … + E( εt) = a t x0 , D( Xt) = ( a2( t–1) + a2( t–2) + … + 1) σ ε2 = [(1 – a2 t) ⁄ (1 – a2 )] σ ε2 = σ ε2 ⁄ (1 – a2 ) – [ a2 t ⁄ (1 – a2 )] σ ε2 , Cov( Xt , Xt+ τ ) = Cov( Xt – a t x0 , Xt+ τ – a t+τ x0 ) = aτ (1 + a2 + … + a2( t–1) ) σ ε2 = aτ (1 – a2 t) σ ε2 ⁄ (1 – a2 ) , так что и математическое ожидание и дисперсия случайной величины Xt , а также ковариации Cov( Xt , Xt+ τ ) зависят от t . В то же время, если a < 1, то при t → ∞ получаем E( Xt) → 0, D( Xt) → σ ε2 ⁄ (1 – a2 ), Cov( Xt , Xt+ τ ) → a τ [ σ ε2 ⁄ (1 – a2 )], Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 7 т.е. при t→ ∞ значения математического ожидания и дисперсии случайной величины X t , а также автоковариации Cov(X t , X t + τ ) стабилизируются, приближаясь к своим предельным значениям. С этой точки зрения, условие a < 1 можно трактовать как условие стабильности ряда, порождаемого моделью X t = aX t–1 + ε t при фиксированном значении X 0 = x 0 Рассмотрим в этой ситуации наряду с только что исследованным рядом X t , 1 0 0 ∑ − = − + = t k k t k t t a x a X ε , a < 1 , ряд, порождаемый моделью
0 ∑ ∞ = − = k k t k t a X ε Имеем: ;
0 k t t k k t t t a x a X X − ∞ = ∑ + − = − ε при t→ ∞ a t x 0 → 0 и 0 2 2 2 → = ∑ ∑ ∞ = ∞ = − t k k t k k t k a a E ε σ ε Таким образом, ряд t X
является предельным для X t ; ряд X t “выходит на режим” t X
при t→ ∞ . При этом выход ряда X t на режим t X
происходит тем быстрее, чем ближе X 0 и a к нулю. Для ряда t X
( ) ( ) , 0
0 0 = = = ∑ ∑ ∞ = − ∞ = − k k t k k k t k t E a a E X E ε ε D( t X
) = ( ) , 1 2 2 0 2 2 0 0 a a D a a D k k k k t k k k t k − = = = ∑ ∑ ∑ ∞ = ∞ = − ∞ = − ε ε σ σ ε ε Cov( t X
, τ
+ t X ) = ( ) , 1 2 2 0 2 2 0 0 a a E a a a a E k k t k k k t k k k t k − = = ∑ ∑ ∑ ∞ = − ∞ = − + ∞ = − ε τ τ τ σ ε ε ε так что t X
– стационарный ряд (в широком смысле). Кроме того, , 1
1 1 ∑ ∞ = − − = k k t k t a a X ε так что ,
0 1 t k k t k t t X a X a = = + ∑ ∞ = − − ε ε т.е. t X
удовлетворяет соотношению
1 t t t X a X ε + = − Поскольку ε t не входит в правую часть выражений для 1
− t X , 2
− t X , ... , то случайная величина ε t не коррелирована с 1
− t X , 2
− t X , … , т.е. ε t является инновацией
Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm 8 (обновлением). В итоге получаем, что tX – стационарный процесс авторегрессии первого порядка, и фактически именно этот процесс имеется в виду, когда говорят о стационарном процессе AR(1). Проиллюстрируем сказанное выше с помощью смоделированных реализаций ряда xt, порожденных моделью Xt = a Xt–1 + εt с σ ε = 0.2 и различными значениями коэффициента a и стартового значения x0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 10 20 30 40 50 60 70 80 90 100 X x0=2; a=0.5 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 10 20 30 40 50 60 70 80 90 100 X x0=0; a1=0.5 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 10 20 30 40 50 60 70 80 90 100 X x0=2; a=0.9 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 10 20 30 40 50 60 70 80 90 100 X x0=0; a=0.9 Рассмотренную только что модель Xt = a Xt–1 + εtназывают процессом авторегрессии первого порядка. |