Главная страница
Навигация по странице:

  • Существует ли вообще такое значение β , при котором ряд y t

  • ряды x

  • (переменные x

  • DGP: x t

  • (CRDW – cointegrating regression DW)

  • Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов


    Скачать 3.08 Mb.
    НазваниеВ. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
    АнкорЭконометрика Введение в регрессионный анализ временных рядо - Носко В.П..pdf
    Дата29.05.2018
    Размер3.08 Mb.
    Формат файлаpdf
    Имя файлаЭконометрика Введение в регрессионный анализ временных рядо - Но.pdf
    ТипДокументы
    #19771
    КатегорияЭкономика. Финансы
    страница21 из 30
    1   ...   17   18   19   20   21   22   23   24   ...   30

    DGP: x
    t
    = x
    t – 1
    + ε
    1t
    , y
    t
    = y
    t – 1
    + ε
    2t
    , где ε
    1t
    и ε
    2t
    последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0, 1), и оценивали статистическую модель
    SM: y
    t
    = α +β x
    t
    + ε
    t
    При оценивании такой статистической модели по наблюдениям с 51 по 100 мы получили:
    T
    β
    ˆ
    = 0.598, t
    β
    = 7.708, DW = 0.214.
    При этом график остатков
    -6
    -4
    -2 0
    2 4
    55 60 65 70 75 80 85 90 95 100
    RESIDS
    не похож на график стационарного ряда.
    Естественно было бы попытаться использовать для выявления такого “неподобающего” поведения остатков не просто визуальное рассмотрение графика остатков, но и формальные статистические критерии, тем более, что критерии проверки интегрированности временных рядов мы уже обсуждали ранее (критерии Дики –
    Фуллера, Филлипса – Перрона и др.).
    Дело, однако, в том, что теперь мы имеем дело не с “сырым” рядом, а с рядом остатков, которые вычисляются после предварительного оценивания модели (коэффициентов α
    и β в последнем примере). Это обстоятельство существенно влияет на распределения соответствующих статистик и не дает возможности пользоваться таблицами, которые мы использовали ранее при анализе на интегрированность сырых рядов. С учетом этого обстоятельства, были построены таблицы, позволяющие производить анализ остатков в случае интегрированных объясняемой и объясняющих переменных, о чем мы поговорим в дальнейшем. Сейчас же только отметим, что дает применение соответствующих таблиц к только что рассмотренному примеру.
    Пример (продолжение)
    При оценивании статистической модели SM: y
    t
    = α +β x
    t
    + ε
    t
    по наблюдениям с 51 по
    100 мы получили оцененную модель
    y
    t
    = 8.616 +0.598 x
    t
    + e
    t

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    9
    С полученным рядом остатков мы поступим так же , как и в случае применения критерия Дики – Фуллера к сырому ряду, т.е. оценим модель
    e
    t
    = φ e
    t – 1
    + ν
    t
    и вычислим t- статистику t
    φ
    для проверки гипотезы H
    0
    : φ = 0, интерпретируя эту гипотезу как гипотезу единичного корня для ряда остатков.
    Гипотеза H
    0
    отвергается в пользу гипотезы H
    A
    : φ < 0 (интерпретируемой как гипотеза стационарности ряда остатков), если t
    φ
    < t
    крит
    . Приближенные значения t
    крит можно найти по формуле
    t
    крит

    2 2
    1 1
    ˆ
    ˆ



    +
    +
    T
    T
    β
    β
    β
    , где
    2 1
    ˆ
    ,
    ˆ
    ,
    ˆ
    β
    β
    β

    зависят от выбранного уровня значимости и указаны в статье
    [MacKinnon (1991)]. Для 5% уровня значимости
    t
    крит
    ≈ – 3.3377 + 5.967 T
    – 1
    – 8.98 T
    – 2
    , что при T = 50 дает t
    крит
    = – 3.46 . Последнее значение существенно меньше 5% критического значения статистики Дики – Фуллера – 2.92, рассчитанного для случая сырого ряда.
    В нашем примере оценивание тестового уравнения Дики – Фуллера дает значение t
    φ
    = – 2.01. Последнее существенно выше 5% критического уровня, и гипотеза единичного корня не отвергается.
    Вообще говоря, вопрос о ложной (паразитной) или неложной (действительной) линейной регрессионной связи между двумя переменными x
    t
    и y
    t
    , представляющими интегрированные ряды первого порядка (x
    t
    , y
    t

    I(1)), более точно формулируется следующим образом.
    Существует ли вообще такое значение β , при котором ряд y
    t
    βx
    t
    стационарен?
    Если ответ на этот вопрос положительный, то говорят что
    ряды x
    t
    и y
    t
    (переменные
    x
    t
    и y
    t
    ) коинтегрированы
    . Если же ответ оказывается отрицательным, то
    ряды x
    t
    и
    y
    t
    (переменные x
    t
    и y
    t
    ) не являются коинтегрированными
    В последнем случае непосредственное оценивание модели y
    t
    = α + β x
    t
    + u
    t
    бессмысленно, т.к. получаемая оценка
    T
    β
    ˆ
    , собственно говоря, не является оценкой какого-либо теоретического параметра связи между переменными x
    t
    и y
    t
    . (См., впрочем, замечание в конце разд. 7.3.)
    Напротив, если переменные x
    t
    и y
    t
    коинтегрированы, то
    T
    β
    ˆ
    является оценкой того единственного значения β , при котором ряд y
    t
    βx
    t
    стационарен
    Заметим теперь, что если в
    DGP: x
    t
    = x
    t – 1
    + ε
    1t
    ,
    y
    t
    = y
    t – 1
    + ε
    2t
    допустить коррелированность значений ε
    1t
    и ε
    2t
    в совпадающие моменты времени, т.е.
    Cov(ε
    1t
    , ε
    2t
    ) ≠ 0, то коррелированность ε
    1t
    и ε
    2t
    вовсе не означает, что ряды x
    t
    и y
    t
    коинтегрированы. Предположим все же, что существует некоторое значение β , при котором y
    t
    = βx
    t
    +
    u
    t
    , где u
    t
    –стационарный ряд. Тогда y
    t – 1
    βx
    t 1
    =
    u
    t – 1
    , так что ∆y
    t
    = β ∆x
    t
    +
    u
    t
    , а отсюда ε
    2t
    =
    β
    ε
    1t
    +
    u
    t
    . Последнее можно записать в виде u
    t
    = u
    t – 1
    + η
    t
    , где
    η
    t
    = ε
    2t

    β
    ε
    1t
    i.i.d. N(0, σ
    η
    2
    ).
    Но это означает, что u
    t
    –нестационарный процесс.

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    10
    С другой стороны, если x
    0
    = y
    0
    = 0, то
    Cov(x
    t
    , y
    t
    ) = Cov(ε
    11
    + … + ε
    1t
    , ε
    21
    + … + ε
    2t
    ) = t Cov(ε
    11
    , ε
    21
    ) , так что x
    t
    и
    y
    t
    – коррелированные, но не коинтегрированные случайные блуждания.
    Существенно, что распределение статистики Дики – Фуллера в подобной ситуации не зависит от конкретного вида матрицы ковариаций Σ = (Cov(ε
    k 1
    , ε
    s 1
    )) , k, s = 1, 2.
    Тем же свойством обладает и распределение статистики Дарбина – Уотсона, примененной к ряду остатков
    (CRDW – cointegrating regression DW)
    :
    e
    t
    = y
    t

    T
    α
    ˆ –
    T
    β
    ˆ
    x
    t
    При T = 50 5% критическое значение последней статистики равно 0.78. Гипотеза некоинтегрированности рядов отвергается, если наблюдаемое значение этой статистики превышает критическое значение.
    В нашем последнем примере значение статистики Дарбина – Уотсона равно 0.214, так что гипотеза некоинтегрированности не отвергается и этим критерием.
    Что следует делать в случае обнаружения паразитной связи между интегрированными порядка 1 переменными x
    t
    и
    y
    t
    ? Имеются три возможных пути обхода возникающих здесь трудностей:
    1.
    Включить в правую часть уравнения запаздывающие значения обеих переменных, точнее, рассмотреть статистическую модель
    SM: y
    t
    = α + β x
    t
    +
    γ y
    t – 1
    + δ x
    t 1
    + u
    t
    , где u
    t
    – стационарный ряд и переменная x
    t
    трактуется как экзогенная .
    Последнее уравнение можно записать иначе в следующих двух формах:
    (a) y
    t
    = α + γ y
    t – 1
    + β x
    t
    +
    (β + δ) x
    t 1
    + u
    t
    ,
    (б) y
    t
    = α +
    γ y
    t – 1
    + (β + δ) x
    t
    δ x
    t
    + u
    t
    В обеих формах слева стоит интегрированная переменная y
    t
    I(1).
    В правой части (а) параметр β является коэффициентом при стационарной переменной ∆x
    t
    , имеющей нулевое математическое ожидание; y
    t – 1
    , x
    t 1
    I(1), u
    t

    стационарный ряд. Как было показано в работе [Sims, Stock, Watson (1990)], в такой ситуации оценки наименьших квадратов для всех коэффициентов SM состоятельны, оценка параметра β асимптотически нормальна. Обычная t- статистика для проверки гипотезы H
    0
    : β = 0 имеет асимптотически нормальное распределение N(0,1), если u
    t
    – белый шум. Аналогично, в правой части (б) параметр δ является коэффициентом при стационарной переменной ∆x
    t
    , имеющей нулевое математическое ожидание; y
    t –1
    , x
    t
    I(1), u
    t
    стационарный ряд.
    Поэтому оценка параметра δ в рамках модели SM асимптотически нормальна, и t- статистика для проверки гипотезы H
    0
    : δ = 0 имеет асимптотически нормальное распределение N(0,1), если u
    t
    – белый шум. Оценки для β и δ остаются асимптотически нормальными и если u
    t
    стационарный ряд, не являющийся белым шумом. Однако при этом асимптотическое распределение N(0,1) имеют

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    11
    скорректированные варианты t-статистик, в знаменателях которых стандартные оценки дисперсии ряда u
    t
    заменяются состоятельными оценками
    долговременной
    дисперсии
    этого ряда, определенной в разд. 6.8.1.
    В то же время, статистика qF = 2F для проверки гипотезы H
    0
    : β = δ = 0 не имеет асимптотического распределения χ
    2
    (2) , поскольку рассматриваемую SM не удается линейно репараметризовать таким образом, чтобы в правой части преобразованного уравнения и β и δ одновременно стали коэффициентами при стационарных переменных, имеющих нулевые математические ожидания. (У нас они становятся таковыми при разных репараметризациях.)
    2. Перед оцениванием модели связи продифференцировать ряды x
    t
    и
    y
    t
    , т.е. рассмотреть модель в разностях
    SM: ∆y
    t
    = α + β x
    t
    + u
    t
    , где u
    t
    стационарный ряд.
    В этой модели оценки наименьших квадратов и для α и для β асимптотически нормальны. Обе t-статистики имеют асимптотически нормальное распределение
    N
    (0,1), если u
    t
    – белый шум. Если u
    t
    стационарный ряд, не являющийся белым шумом, то необходимо произвести коррекцию t-статистик, как и в предыдущем пункте.
    3. Использовать для оценивания модель регрессии с автокоррелированными остатками
    SM: y
    t
    = α + β x
    t
    + u
    t
    , u
    t
    = ρ x
    t – 1
    + ε
    t
    , u
    t
    i.i.d. N(0, σ
    ε
    2
    ).
    При этом предпочтительнее оценивать все три параметра α, β, ρ одновременно, используя представление
    y
    t
    – ρ y
    t – 1
    = α(1 – ρ)+ β (x
    t
    ρ x
    t – 1
    )+
    ε
    t
    В случае ложной регрессии
    ρ
    ˆ → 1 (по вероятности), так что, фактически, при больших T этот метод равносилен предварительному дифференцированию рядов.
    Пример
    Применим указанные три подхода к анализу реализаций, смоделированных ранее в этом разделе в соответствии с
    DGP: x
    t
    = x
    t – 1
    + ε
    1t
    , y
    t
    = y
    t – 1
    + ε
    2t
    , где ε
    1t
    и ε
    2t

    последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0,1). Для анализа используем последние 50 наблюдений.
    (1)
    Применяя первый подход, получаем оцененную модель
    Dependent Variable: Y
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    C
    0.447271 0.550358 0.812691 0.4206
    X -0.014458 0.123861
    -0.116725 0.9076
    Y(-1)
    0.970105 0.055989 17.32664 0.0000
    X(-1)
    0.033532 0.120061 0.279290 0.7813
    Наблюдаемые P-значения для коэффициентов при переменных x
    t и x
    t – 1
    указывают на то, что переменная x
    t
    фактически не объясняет изменчивость переменной y
    t
    (2)
    Применяя второй подход, получаем оцененную модель
    Dependent Variable: D(Y)

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    12
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    C
    0.184523 0.117614 1.568884 0.1232
    D(X) -0.033386 0.116361
    -0.286915 0.7754
    Оба коэффициента статистически незначимы, и это отражает некоррелированность рядов ε
    1t
    и ε
    2t
    (3)
    Применяя третий подход, оцениваем модель
    y
    t
    – ρ y
    t – 1
    = α(1 – ρ)+ β (x
    t
    ρ x
    t – 1
    )+
    ε
    t
    , т.е.
    y
    t
    = α
    *
    + ρ y
    t – 1
    + β (x
    t
    ρ x
    t – 1
    )+
    ε
    t
    .
    При этом получаем:
    Dependent Variable: Y
    Method: Least Squares
    Convergence achieved after 7 iterations
    Y=C(1)+C(2)*Y(-1)+C(3)*(X-C(2)*X(-1))
    Coefficient Std. Error t-Statistic
    Prob.
    C(1)
    0.217398 0.159423 1.363650 0.1792
    C(2)
    0.988791 0.035801 27.61920 0.0000
    C(3) -0.027306 0.119276
    -0.228934 0.8199
    R-squared
    0.940380 Mean dependent var
    3.404232
    Как и ожидалось, коэффициент при y
    t – 1
    оказался очень близким к 1, а два других коэффициента статистически незначимы. Проверка на одновременное зануление этих двух коэффициентов дает P-значение 0.367.
    Пример
    Изменим процесс порождения данных, оставляя те же формулы для x
    t
    и
    y
    t
    , т.е.
    x
    t
    = x
    t – 1
    + ε
    1t
    , y
    t
    = y
    t – 1
    + ε
    2t
    , но теперь пусть
    ε
    1t

    последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25),
    ε
    2t

    последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25),
    Cov
    (ε
    1t
    , ε
    2s
    ) = 0 для t s , Cov(ε
    1t
    , ε
    2t
    ) = 1.
    Отсюда, в частности, следует, что Corr(ε
    1t
    , ε
    2t
    ) = 0.8 .
    Смоделированные реализации ε
    1t
    и ε
    2t
    имеют вид

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    13
    -3
    -2
    -1 0
    1 2
    3 10 20 30 40 50 60 70 80 90 100
    NOISE_X
    NOISE_Y
    Траектории смоделированной пары рядов ε
    1t
    и ε
    2t
    ведут себя достаточно согласованным образом; оцененный коэффициент корреляции между этими рядам равен 0.789. Полученные при этом реализации рядов x
    t
    и y
    t
    ведут себя, как показано ниже на правом рисунке. Для сравнения на левом рисунке показано поведение реализаций рядов ε
    1t
    и ε
    2t
    при их полной статистической независимости.
    -20
    -15
    -10
    -5 0
    5 10 10 20 30 40 50 60 70 80 90 100
    X
    Y
    -20
    -15
    -10
    -5 0
    5 10 10 20 30 40 50 60 70 80 90 100
    X
    Y
    Для сопоставимости с ранее полученными результатами, опять обратимся ко второй части отрезка наблюдений; здесь оцененный коэффициент корреляции между рядами
    ε
    1t
    и ε
    2t
    равен 0.792.
    Сначала оценим модель y
    t
    = α + β x
    t
    + u
    t
    . В результате получаем для ряда остатков значение статистики Дики – Фуллера, равное 2.112, которое выше 5% критического уровня 3.46. Соответственно, гипотеза о ложности регрессионной связи не отвергается.
    (1)
    Применяя первый подход, получаем оцененную модель
    Dependent Variable: Y
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    C
    0.548392 0.377080 1.454312 0.1526
    X
    0.718479 0.079943 8.987361 0.0000
    Y(-1)
    0.913556 0.067811 13.47210 0.0000
    X(-1) -0.641522 0.088805
    -7.223976 0.0000
    R-squared
    0.987574 Mean dependent var
    -0.957402
    По сравнению с ранее рассмотренным случаем, в котором ряды ε
    1t
    и ε
    2t
    были между собой статистически не связанными, теперь оказываются статистически значимыми и

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    14
    коэффициенты при переменных x
    t
    и x
    t – 1
    . Исключая из правой части модели константу, получаем:
    Dependent Variable: Y
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    X
    0.695862 0.079341 8.770553 0.0000
    Y(-1)
    1.005257 0.025245 39.82053 0.0000
    X(-1) -0.707002 0.077447
    -9.128837 0.0000
    R-squared
    0.987003 Mean dependent var
    -0.957402 т.е. y
    t
    = 1.005 y
    t – 1
    + 0.695 x
    t
    0.707 x
    t – 1
    + e
    t
    . Оценка коэффициента при y
    t – 1 близка к
    1; оцененные коэффициенты при x
    t
    и x
    t – 1 близки по абсолютной величине и противоположны по знаку, что вполне согласуется с реализованной моделью DGP.
    (2)
    Применяя второй подход, получаем оцененную модель
    Dependent Variable: D(Y)
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    C
    0.100915 0.083851 1.203508 0.2347
    D(X)
    0.694000 0.077274 8.981039 0.0000
    R-squared
    0.626921 Mean dependent var
    0.226857
    И здесь, в отличие от ранее использовавшегося DGP, становится значимым коэффициент при переменной ∆x
    t
    , что отражает коррелированность случайных величин ε
    1t
    и ε
    2t
    , т.е. коррелированность ∆x
    t и ∆y
    t
    . Исключая из правой части уравнения статистически незначимую константу, получаем:
    Dependent Variable: D(Y)
    Variable
    Coefficient Std. Error t-Statistic
    Prob.
    D(X)
    0.709553 0.076533 9.271155 0.0000 т.е. ∆y
    t
    =
    0.710 ∆x
    t
    + e
    t
    , или y
    t
    = y
    t – 1
    + 0.710 x
    t
    0.710 x
    t – 1
    + e
    t
    (3)
    Наконец, применяя третий подход, оцениваем модель
    y
    t
    = α
    *
    + ρ y
    t – 1
    + β (x
    t
    ρ x
    t – 1
    )+
    ε
    t
    ; при этом получаем:
    Dependent Variable: Y
    Convergence achieved after 8 iterations
    Y=C(1)+C(2)*Y(-1)+C(3)*(X-C(2)*X(-1))
    Coefficient Std. Error t-Statistic
    Prob.
    C(1)
    0.329205 0.250398 1.314726 0.1950
    C(2)
    0.941984 0.056946 16.54170 0.0000
    C(3)
    0.723593 0.079341 9.119982 0.0000
    R-squared
    0.987410 Mean dependent var
    -0.957402
    Здесь становится статистически значимым коэффициент β .
    Исключение из правой части константы дает:
    Dependent Variable: Y
    Convergence achieved after 4 iterations
    Y=C(2)*Y(-1)+C(3)*(X-C(2)*X(-1))

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    15
    Coefficient Std. Error t-Statistic
    Prob.
    C(2)
    1.014411 0.020750 48.88608 0.0000
    C(3)
    0.702102 0.078268 8.970448 0.0000 т.е. y
    t
    = 1.014 y
    t – 1
    + 0.702(x
    t
    – 1.014 x
    t – 1
    )+
    e
    t
    , или
    y
    t
    = 1.014 y
    t – 1
    + 0.702 x
    t
    – 0.712 x
    t – 1
    +
    e
    t
    Отметим близость результатов, полученных тремя методами:
    y
    t
    = 1.005 y
    t – 1
    + 0.695 x
    t
    0.707 x
    t – 1
    + e
    t
    (метод 1),
    y
    t
    = y
    t – 1
    + 0.710 x
    t
    0.710 x
    t – 1
    + e
    t
    (метод 2),
    y
    t
    = 1.014 y
    t – 1
    + 0.702 x
    t
    – 0.712 x
    t – 1
    +
    e
    t
    (метод 3).
    Фактически, во всех трех случаях воспроизводится одна и та же линейная модель связи между рядами разностей:
    y
    t
    =
    0.7 ∆x
    t
    + e
    t
    Эта регрессионная связь между продифференцированными рядами не является ложной
    (в отличие от регрессионной связи между рядами уровней): статистика Дарбина –
    Уотсона принимает значение 1.985; P-значение критерия Jarque – Bera равно 0.344.
    Замечание
    В связи с результатами, полученными при рассмотрении последних примеров, естественно возникает следующий вопрос, который поднимался в свое время различными исследователями. Не будет ли разумным, имея дело с рядами, траектории которых обнаруживают выраженный тренд, сразу приступать к оцениванию связей между рядами разностей (между продифференцированными рядами) ?
    Против некритичного использования такого подхода говорят два обстоятельства:
    (a) Если ряды в действительности стационарны относительно детерминированного тренда, то тогда дифференцирование приводит к
    1   ...   17   18   19   20   21   22   23   24   ...   30


    написать администратору сайта