Главная страница
Навигация по странице:

  • (статистика Бокса – Пирса)

  • Prob Prob Prob 1 0.670 13 0.064 25 0.061 0.873 4 0 .045 6 0.077 0.292 5 0 .049

  • Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П.. Эконометрика Введение в регрессионный анализ временных рядо - Но. В. П. Носко Эконометрика Введение в регрессионный анализ временных рядов


    Скачать 3.08 Mb.
    НазваниеВ. П. Носко Эконометрика Введение в регрессионный анализ временных рядов
    АнкорЭконометрика Введение в регрессионный анализ временных рядо - Носко В.П..pdf
    Дата29.05.2018
    Размер3.08 Mb.
    Формат файлаpdf
    Имя файлаЭконометрика Введение в регрессионный анализ временных рядо - Но.pdf
    ТипДокументы
    #19771
    КатегорияЭкономика. Финансы
    страница5 из 30
    1   2   3   4   5   6   7   8   9   ...   30

    A
    CF
    P
    ACF
    A
    CF
    P
    ACF
    A
    CF
    P
    ACF
    -
    0.019
    -
    0.019
    3
    0
    .102
    0
    .126
    5
    -
    0.053
    -
    0.031
    -
    0.013
    -
    0.014
    4
    -
    0.071
    -
    0.051
    6
    -
    0.015
    -
    0.018
    -
    0.083
    -
    0.083
    5
    -
    0.044
    -
    0.036
    7
    -
    0.064
    -
    0.035 0
    .038 0
    .035
    6
    0
    .017 0
    .034
    8
    0
    .032 0
    .042
    -
    0.047
    -
    0.049
    7
    -
    0.083
    -
    0.115
    9
    -
    0.057
    -
    0.075 0
    .017 0
    .009
    8
    0
    .035 0
    .028
    0
    -
    0.053
    -
    0.044
    -
    0.024
    -
    0.019
    9
    -
    0.049
    -
    0.085
    1
    0
    .011
    -
    0.006 0
    .062 0
    .053
    0
    0
    .069 0
    .032
    2
    0
    .034 0
    .021 0
    .061 0
    .069
    1
    0
    .041 0
    .022
    3
    0
    .029 0
    .034
    0
    0
    .074 0
    .073
    2
    -
    0.014
    -
    0.057
    4
    -
    0.042
    -
    0.057
    1
    0
    .079 0
    .099
    3
    -
    0.035
    -
    0.018
    5
    0
    .013 0
    .064
    2
    0
    .021 0
    .034
    4
    0
    .034 0
    .012
    6
    0
    .046 0
    .055
    Рассматривая значения ACF, мы замечаем, что из полосы ± 2/√
    T = ±0.0895 выбивается значение
    r(13) = 0.102. Означает ли это, что мы должны отвергнуть гипотезу
    H
    0
    :
    X
    t
    – белый шум? Рассматривая значения PACF, мы также обнаруживаем значения, выходящие за пределы этой полосы, что приводит к тому же вопросу.
    Поскольку количество наблюдений у нас весьма велико (
    T = 499), можно воспользоваться утверждением об асимптотической независимости
    r
    part
    (
    k), k = 1, 2, … .
    Пусть
    B
    k
    событие, состоящее в том, что r
    part
    (
    k) выходит за пределы полосы ± 2/√T .
    Вероятность этого события приближенно равна 0.05. Тогда вероятность выхода за пределы полосы ровно двух (из 36)
    r
    part
    (
    k), k = 1, 2, …, 36, приближенно равна
    P
    2
    =
    C
    36 2
    (0.05)
    2
    (1– 0.05)
    36–2
    = (36·35/2) ·0.05 2
    ·0.95 34
    ,

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    7
    и lg(
    P
    2
    ) = lg(630) + 2lg(0.05) + 34lg(0.95) = – 0.560.
    Отсюда находим:
    P
    2
    = 0.275, так что вероятность двух выходов из полосы графика выборочной PACF при рассмотрении 36 лагов вовсе не мала.
    Что касается вероятности единственного выхода из полосы выборочной ACF, то здесь мы можем воспользоваться утверждением об асимптотической независимости
    r(k), k = 1, 2, … при условии, что X
    t
    – белый шум (в случае MA(q) процесса с q ≥ 1 это не так). При этом вероятность наличия единственного выхода выборочной ACF из все той же полосы приближенно равна
    P
    1
    =
    C
    36 1
    (0.05)(1– 0.05)
    35
    , так что lg(
    P
    1
    ) = – 0.780, откуда находим:
    P
    1
    = 0.166.
    Рассмотренный пример показывает, что к интерпретации графиков выборочных
    ACF и PACF следует подходить достаточно осторожно. Сюда же относится и то обстоятельство, что выражение, используемое при вычислении значений
    r(k) в пакете
    EVIEWS, отличается от приведенного выше: в формуле для
    )
    (
    ˆ k
    γ
    деление производится не на
    T – k , а на T . Последнее приводит к тому, что так вычисляемая оценка для ρ(k) имеет смещение в направлении нуля.
    В распечатках анализа временных рядов вместе с графиками выборочных ACF и
    PACF обычно печатаются значения
    Q-статистики
    , относящиеся к критерию проверки гипотезы о том, что наблюдаемые данные являются реализацией процесса белого шума.
    Существует несколько вариантов
    Q-статистик. Одна из таких статистик
    (статистика Бокса – Пирса)
    была предложена Боксом и Пирсом [Box, Pearce (1970)] и имеет вид

    =
    =
    M
    k
    k
    r
    T
    Q
    1 2
    )
    (
    Вспомним уже упоминавшиеся ранее результаты об асимптотической независимости
    r(1), r(2), …, r(M) в случае, когда X
    t
    – белый шум, и заметим, что при больших
    T в этом случае√T · r(k) ≈ N (0, 1), так что T r
    2
    (
    k) [N (0, 1)]
    2
    =
    χ
    2
    (1) .
    (Заметим, что в этой ситуации не требуется гауссовость
    X
    t
    – см. [Хеннан (1974)].)
    Отсюда вытекает, что при больших
    T приближенно имеем
    Q

    χ
    2
    (
    M).
    Против гипотезы
    H
    0
    говорят скорее большие значения этой статистики. Поэтому если выбрать уровень значимости равным 0.05, то естественно отвергать эту гипотезу при выполнении неравенства
    Q > χ
    2 0.95
    (
    M).
    В распечатках коррелограмм приводятся
    P-значения статистики Q для последовательных значений
    M = 1, 2, … . При конкретном значении M гипотеза H
    0 отвергается, когда соответствующее
    P-значение меньше 0.05.
    Впрочем, исследования показали, что статистика Бокса – Пирса плохо приближается распределением
    χ
    2
    (
    M) при умеренных значениях T . Вместо нее в таких случаях предпочтительнее использовать
    статистику Люнга – Бокса
    [Ljung,
    Box (1979)]

    =

    +
    =
    M
    k
    k
    T
    k
    r
    T
    T
    Q
    1 2
    )
    (
    )
    (
    )
    2
    (
    ,

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    8
    которая (при T → ∞) также имеет асимптотическое распределение χ
    2
    (M), но ближе к этому распределению при умеренных значениях T , чем статистика Бокса –
    Пирса. В пакете EVIEWS (Econometric Views) значения статистики Люнга – Бокса распечатываются вместе с приближенными P-значениями, соответствующими распределениям χ
    2
    (M).
    Практическое использование Q-статистик наталкивается на определенные трудности. Посмотрим на таблицу P-значений (Prob) Q-статистики Люнга – Бокса для только что рассмотренного примера с реализацией процесса белого шума.
    Prob
    Prob
    Prob
    1 0
    .670 13 0
    .064 25 0
    .061 0
    .873 4
    0
    .045
    6 0
    .077 0
    .292 5
    0
    .049
    7 0
    .063 0
    .348 6 0
    .066 8 0
    .072 0
    .349 7
    0
    .037
    9 0
    .065 0
    .455 8
    0
    .044
    0 0
    .061 0
    .539 9
    0
    .044
    1 0
    .076 0
    .438 0
    0
    .033
    2 0
    .084 0
    .360 1
    0
    .037
    3 0
    .096 0
    0
    .243 2
    0
    .049
    4 0
    .099 1
    0
    .146 3 0
    .056 5 0
    .119 2
    0
    .187 4 0
    .064 6 0
    .119
    P-значения, соответствующие M = 14, 15, 17 – 22, меньше 0.05, так что формально при использовании статистики Люнга – Бокса с любым из этих значений M
    гипотеза H
    0
    : “X
    t
    – белый шум” должна отвергаться, тогда как при остальных значениях M соответствующие P-значения больше, чем 0.05, и гипотеза H
    0
    при таких значениях M не отвергается.
    Какого-либо определенного рецепта, указывающего, как поступать в подобных ситуациях, на какое значение M следует ориентироваться, до сих пор не существует.
    Среди многочисленных исследований в этом направлении можно отметить работы
    [Kwan (1996a,b)].

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    9
    Уже из рассмотренного примера ясно, что на этапе выбора подходящей модели среди всего множества ARMA моделей используемые процедуры являются не вполне точными и часто приводят к довольно неопределенным выводам. В итоге этого этапа возможно оставление для дальнейшего исследования не одной, а нескольких потенциальных моделей. Более определенные выводы при выборе модели на первом этапе можно получить, применяя информационные критерии отбора моделей.
    Использование информационных критериев.
    Если заранее ограничиваться рассмотрением только AR моделей, т.е. полагать, что процесс X
    t
    следует модели AR(k)

    =
    k
    j
    kj
    a
    1
    (X
    t – j
    – µ) = ε
    t
    , a
    k0
    = 1, с неизвестным истинным порядком k , то для определения k в таких ситуациях долгое время использовался
    информационный критерий Акаике
    [Akaike (1973)].
    Согласно этому критерию, среди альтернативных значений k выбирается значение, которое минимизирует величину
    )
    2
    (
    ˆ
    ln
    )
    AIC(
    2
    T
    k
    k
    k
    +
    =
    σ
    где T – количество наблюдений, а
    2
    ˆ
    k
    σ
    оценка дисперсии инноваций ε
    t
    в AR модели k-го порядка. Для вычисления
    2
    ˆ
    k
    σ
    производится подбор модели k-го порядка с использованием уравнений Юла – Уокера
    j
    s
    k
    j
    j
    k
    s
    a
    1

    =

    =
    ρ
    ρ
    , полученные оценки коэффициентов
    j
    k
    a
    ˆ
    , j = 1, … , k , подставляются вместо
    j
    k
    a
    в уравнение модели, µ заменяется на
    x
    , так что получаются оценки для ε
    t
    ,
    (
    )
    x
    x
    a
    j
    t
    k
    j
    j
    k
    t

    =

    =

    0
    ˆ
    ˆ
    ε
    , после чего
    2
    ˆ
    k
    σ
    определяется как
    2
    ˆ
    k
    σ =

    =
    T
    t
    t
    T
    1 2
    ˆ
    1
    ε
    Впоследствии было выяснено, что оценка Акаике несостоятельна и асимптотически переоценивает (завышает) истинное значение k
    0
    с ненулевой вероятностью. В связи с этим, были предложены состоятельные критерии, основанные на минимизации суммы ln
    2
    ˆ
    k
    σ + k c
    T
    , где c
    T
    = O(T
    1
    ln T) (т.е. c
    T
    при T → ∞ имеет тот же порядок малости, что и
    T
    1
    ln T
    ).
    Одним из таких критериев является часто используемый в настоящее время
    информационный критерий Шварца
    SIC [Schwarz (1978)],
    T
    T
    k
    k
    ln
    ˆ
    ln
    SIC
    2
    +
    =
    σ
    Несколько позднее был предложен
    критерий Хеннана – Куинна
    [Hannan, Quinn
    (1979)], в котором c
    T
    = 2ck T
    1
    lnlnT , c > 1,

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    10
    T
    T
    c
    k
    k
    ln ln
    2
    ˆ
    ln
    HQ
    2
    +
    =
    σ
    , обладающий более быстрой сходимостью к истинному значению k
    0
    при T → ∞ .
    Однако при небольших значениях T этот критерий недооценивает порядок авторегрессии.
    Пример
    Рассмотрим модель процесса AR(2)
    X
    t
    = 1.2 X
    t-1
    – 0.36 X
    t-2
    + ε
    t
    Уравнение a(z) = 0 принимает в этом случае вид
    1– 1.2 z + 0.36 z
    2
    = 0 и имеет двойной корень z = 5/3 > 1, так что процесс, порождаемый такой моделью стационарен.
    Cмоделированная реализация этого процесса для t = 1, 2, …, 500 имеет следующий вид.
    -8
    -4 0
    4 8
    50 100 150 200 250 300 350 400 450 500
    PRIM1
    Построенная по этой реализации выборочная коррелограмма имеет вид:
    ACF PACF A
    C
    PAC
    Q-Stat Prob
    .|*******
    .|*******
    0
    .899
    0
    .899
    4 06.25 .000
    .|******
    ***|.
    0
    .732
    -
    0.396
    6 75.97 .000
    .|****
    .|.
    0
    .561
    -
    0.005 8
    34.98 .000
    .|***
    .|.
    0
    .409
    -
    0.027 9
    19.59 .000
    .|**
    .|.
    0
    .277
    -
    0.048 9
    58.40 .000
    .|*
    .|.
    0
    .167
    -
    0.015 9
    72.59 .000
    .|*
    .|*
    0
    .095 0
    .071 9
    77.15 .000
    .|.
    .|.
    0
    .045
    -
    0.045 9
    78.19 .000
    .|.
    .|.
    0 0
    9

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    11
    .014 .011 78.29 .000
    .|.
    .|.
    0
    -
    0.001 0
    .020 9
    78.29 .000
    .|.
    .|.
    1 0
    .003 0
    .055 9
    78.30 .000
    .|.
    .|.
    2 0
    .019 0
    .001 9
    78.49 .000
    Здесь из полосы ± 2/√T = ± 0.089 выходят только значения выборочной PACF, соответствующие лагам k = 1, 2. В соответствии с приближенным критерием, упомянутым ранее, это приводит к неотвержению гипотезы H
    0
    : X
    t
    AR(2).
    Для подтверждения этой гипотезы сравним значения информационных критериев
    Акаике и Шварца, получаемые при оценивании AR моделей 4-го, 3-го, 2-го и 1-го порядков, допускающих ненулевое математическое ожидание соответствующих AR процессов.
    p =
    1
    p
    = 2
    p =
    3
    p =
    4
    IC
    3.0 83264
    2.
    91800
    2.9 19244 2.9 24441
    IC
    3.1 00148
    2.
    94336
    2.9 53116 2.9 66846
    Оба критерия выбирают модель AR(2).
    Если мы не ограничиваем себя моделями AR и допускаем, что модель, порождающая данные, имеет вид ARMA(p
    0
    , q
    0
    ) (с неизвестными p
    0
    , q
    0
    )
    a(L) X
    t
    = b(L) ε
    t
    , то в этом случае имеется несколько процедур оценивания пары (p
    0
    , q
    0
    ), одну из которых мы сейчас рассмотрим (см. [Kavalieris (1991)]).
    На первом шаге этой процедуры уже известными нам методами производится подбор модели авторегрессии AR(k)
    ,
    1
    ,
    0 0
    =
    =

    =

    k
    t
    j
    t
    k
    j
    j
    k
    a
    X
    a
    ε
    вычисляются оценки коэффициентов
    j
    k
    a
    ˆ
    , j = 1, … , k, и на их основе получаются оценки инноваций
    1
    ˆ
    ,
    ˆ
    )
    (
    ˆ
    0 0
    =
    =

    =

    k
    j
    t
    k
    j
    j
    k
    k
    a
    x
    a
    t
    ε
    Порядок k авторегрессионной модели на этом шаге должен быть достаточно высоким. Его можно выбрать, опираясь на сравнение значений критерия Акаике для оцененных моделей авторегрессии различных порядков. (Вспомним, что критерий
    Акаике склонен завышать порядок модели, а это в данном случае нас как раз и устраивает.)
    На втором шаге берутся регрессии X
    t
    на X
    t – j
    , j = 1, …, p, и регрессии X
    t
    на
    ˆ
    k
    ε
    (t –
    j),
    j = 1, …, q. По первым из них получаем начальные оценки наименьших квадратов

    Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru www.iet.ru/mipt/2/text/curs_econometrics.htm
    12
    для параметров a
    j
    , т.е.
    j
    k
    a
    ˆ
    , j = 1, …, p, а по вторым – оценки
    j
    b
    ˆ
    для b
    j
    ,
    j = 1, …, q.
    Соответственно, оценками полиномов a(z), b(z) служат
    ,
    ˆ
    )
    (
    ,
    ˆ
    )
    (
    0 0
    j
    q
    j
    j
    j
    p
    j
    j
    z
    b
    z
    b
    z
    a
    z
    a


    =
    =
    =
    =
    и с помощью оцененных полиномов получаем оценку для инноваций
    t
    t
    x
    L
    a
    L
    b
    )
    (
    ˆ
    )
    (
    ˆ
    ˆ
    1

    =
    ε
    ,
    на основании которой строим уточненную оценку для дисперсии инноваций

    =
    =
    T
    t
    t
    q
    p
    T
    1 2
    2
    ,

    1

    ε
    σ
    При этом предполагается, что сами инновации, зная точно коэффициенты ARMA модели, можно найти по формуле
    t
    t
    x
    L
    a
    L
    b
    )
    (
    )
    (
    1

    =
    ε
    что соответствует обратимости этой модели.
    В качестве оценок для p
    0
    , q
    0 берется пара значений
    ( )
    q
    p
    ,

    ,
    при которой минимизируется величина
    ( )
    T
    T
    q
    p
    q
    p
    q
    p
    ln
    )
    (

    ln

    SIC
    2
    ,
    2
    ,
    +
    +
    =
    σ
    σ
    Существенно, что
    ( )
    2
    ,

    SIC
    q
    p
    σ
    – возрастающая функция от p и q , когда pp
    0
    , q
    q
    0
    , что ведет к состоятельности оценок
    ( )
    q
    p
    ,

    1   2   3   4   5   6   7   8   9   ...   30


    написать администратору сайта