Главная страница
Навигация по странице:

  • 4.2. Оценивание коэффициентов авторегрессионной модели

  • Замечание 4.2.1.

  • Замечание 4.2.2.

  • Пример 4.2.1.

  • Регрессия

  • 4.3. Оценивание коэффициентов авторегрессионной модели стационарного временного ряда

  • Эконометрика в Excel (часть 2). Ю. Е. Воскобойников


    Скачать 1.67 Mb.
    НазваниеЮ. Е. Воскобойников
    Дата29.11.2022
    Размер1.67 Mb.
    Формат файлаpdf
    Имя файлаЭконометрика в Excel (часть 2).pdf
    ТипУчебное пособие
    #818575
    страница7 из 9
    1   2   3   4   5   6   7   8   9
    Глава 4. АВТОРЕГРЕССИОНЫЕ МОДЕЛИ
    ВРЕМЕННОГО РЯДА
    4.1. Определение авторегрессионной модели
    Ранее, при выделении тренда (см. главу 2), в качестве объяс- няющей переменной (или регрессора) модели временного ряда выступало время
    τ
    . Однако в эконометрике достаточно широкое распространение получили регрессионные модели, в которых регрессорами выступают лаговые переменные, влияние которых характеризуется некоторым «запаздыванием». Наиболее часто в качестве такой модели используются авторегрессионные модели
    вида (1.1.4).Использование авторегрессионных моделей для опи- сания временного ряда основано на предположении о том, что те- кущее значение временного ряда может быть выражено в виде линейной комбинации некоторого количества предыдущих его значений и случайной величины, обладающей свойствами «бело- го» шума.
    Общий вид моделиавторегрессииp -го порядка (или модель
    AR(p)) имеет вид
    0 1
    1 2
    2
    ,
    1,2, ,
    i
    i
    i
    p i p
    i
    y
    y
    y
    y
    i
    n
    β
    β
    β
    β
    ε



    =
    +
    +
    + +
    +
    =

    , (4.1.1) где
    0 1
    , ,...,
    p
    β β
    β
    – коэффициенты модели,
    i j
    y

    – лаговые перемен- ные, определяющие зависимость значения
    i
    y временного ряда в момент
    i
    τ
    от значений в предыдущие моменты времени. Эти ла- говые переменные и выступают в роли регрессоров (объясняю- щих переменных). Возмущения
    i
    ε
    удовлетворяют условиям Га- усса–Маркова:
    Р1.
    ( ) 0
    i
    M
    ε
    = .
    (4.1.2)
    Р2.
    Корреляционные моменты случайных величин ,
    i
    j
    ε ε
    удов- летворяют условию
    2
    ,
    ;
    (
    )
    0,
    i
    j
    если i
    j
    M
    если i
    j
    σ
    ε ε

    =
    = ⎨


    (4.1.3)
    128
    Первая строка означает постоянство дисперсии возмущений
    i
    ε
    , и это свойство называют гомоскедастичностью. Зависимость дис- персии возмущения
    i
    ε
    от номера наблюдения i называется гете-
    роскедакстичностью.
    Р3.
    Случайные величины
    i
    ε
    подчиняются нормальному рас- пределению с нулевым средним и дисперсией
    2
    σ
    Для вектора
    1 2
    n
    ε
    ε
    ε
    ε
    =
    (4.1.4) условия Гаусса–Маркова примут вид:
    Р1.
    [ ]
    0
    n
    M
    ε
    =
    ,
    (4.1.5) где 0
    n
    – вектор, все
    n проекций которого равны нулю (т.е. нуле- вой вектор).
    Р2.
    2
    ,
    T
    V
    M
    I
    ε
    ε ε
    σ


    =
    =


    (4.1.6) где V
    ε
    – ковариационная матрица размера n n
    × ; I – единичная матрица размера n
    ×n. Напомним, что ,ii -й элемент ковариацион- ной матрицы V
    ε
    определяет дисперсию i-й проекции вектора
    ε
    , а
    i, j-й элемент равен корреляционному моменту
    ,
    i j
    μ
    =
    i
    j
    M
    ε ε




    ⎦ .
    Если проекции
    i
    ε
    и
    j
    ε
    статистически независимы, то
    ,
    0
    i j
    μ
    = и матрица
    V
    ε
    является диагональной.
    Р3.
    Случайный вектор
    ε
    подчиняется нормальному распреде- лению
    2
    (0 ,
    )
    n
    N
    I
    σ
    Наиболее часто используются:
    авторегрессионная модель первого порядка (или модель
    AR(1)):
    0 1
    1
    ,
    1,2, ,
    i
    i
    i
    y
    y
    i
    n
    β
    β
    ε

    =
    +
    +
    =

    ;
    (4.1.7)

    129
    авторегрессионная модель второго порядка (или модель
    AR(2)):
    0 1
    1 2
    2
    ,
    1,2, ,
    i
    i
    i
    i
    y
    y
    y
    i
    n
    β
    β
    β
    ε


    =
    +
    +
    +
    =
    … . (4.1.8)
    Построение модели типа (4.1.1) предполагает решение двух взаимосвязанных задач:
    ƒ
    определение порядка p авторегрессионной модели вре- менного ряда;
    ƒ
    оценивание коэффициентов
    i
    β
    Рассмотрим сначала задачу оценивания коэффициентов
    i
    β
    4.2. Оценивание коэффициентов авторегрессионной модели
    Так как лаговые переменные по своей сути являются объяс- няющими переменными, то модель (4.1.1) можно рассматривать как линейную множественную регрессию, коэффициенты кото- рой можно оценить на основе классического метода наименьших квадратов, записав для модели (4.1.1) следующее уравнение рег- рессии:
    0 1
    1 2
    2
    ,
    1,2, ,
    i
    i
    i
    p i p
    y
    b
    b y
    b y
    b y
    i
    n



    =
    +
    +
    + +
    =

    , (4.2.1) коэффициенты которого являются оценками для
    0 1
    , ,...,
    p
    β β
    β
    со- ответственно.
    Тогда матрица
    Χ размера
    (
    1)
    n
    p
    ×
    + , входящая в матричную запись системы нормальных уравнений, имеет вид
    0 1
    1 1
    0 2
    2 1
    3 1
    2 1
    1 1
    1
    p
    p
    p
    n
    n
    n p
    y
    y
    y
    y
    y
    y
    y
    y
    y
    X
    y
    y
    y

    − +
    − +
    − +



    =
    (4.2.2)
    Для моделей AR(1), AR(2) матрицы
    Χ содержат элементы:
    130 0
    1 2
    1 1
    1 1
    1
    n
    y
    y
    y
    y

    Χ =
    ;
    0 1
    1 0
    2 1
    1 2
    1 1
    1 1
    n
    n
    y
    y
    y
    y
    y
    y
    y
    y



    Χ =
    (4.2.3)
    Замечание 4.2.1.
    Начальные значения
    0 1
    1
    ,
    ,...,
    p
    y y
    y

    − +
    , входя- щие в матрицу
    Χ , как правило, неизвестны, и поэтому их необхо- димо доопределить. Например,
    0
    y
    y
    = – среднее значение наблю- даемых значений,
    1 2
    1 0
    p
    y
    y
    y


    − +
    =
    = =
    = . Этот способ использу- ется в примере 4.2.1. Возможны и другие способы задания этих
    начальных значений. Например, сдвинуть точку отсчета времен- ного ряда на несколько значений вправо. Так, если
    2
    p
    = , то
    1 1
    0 2
    1 3
    ,
    ,
    , ,
    n p
    n
    y
    y y
    y y
    y
    y
    y


    =
    =
    =
    =

    ,
    (4.2.4) что позволяет устранить «произвол» в определение начальных значений.

    Определив вектор наблюдений y как
    1 2
    , ,...,
    T
    n
    y
    y y
    y
    =
    , при- ходим к системе нормальных уравнений:
    T
    T
    X Xb
    X y
    =
    , где вектор
    0 1
    , ,...,
    p
    b
    b b
    b
    =
    содержит искомые оценки для коэффи- циентов
    0 1
    , ,...,
    p
    β β
    β
    авторегрессионной модели. Предполагая, что обратная матрица
    (
    )
    1
    T

    Χ Χ
    существует, находим вектор b :
    (
    )
    1
    T
    T
    b
    X X
    X y

    =
    (4.2.5)
    После этого уравнение регрессии (4.2.1) можно использовать для прогнозирования временного ряда, описываемого авторегрес- сионной моделью.
    Замечание 4.2.2.
    Существенным предположением, при кото- ром вектор b является несмещенной и состоятельной оценкой

    131 для вектора коэффициентов
    β
    является предположение, что мат- рица Х является неслучайной [5, с. 72]. В нашем случае матрица
    Х (4.2.2) является случайной, так как элементами ее являются случайные величины – лаговые переменные
    1
    ,...,
    i
    i p
    y
    y


    . Наруше- ние этого предположения приводит к тому, что вектор b уже не
    является несмещенной и состоятельной оценкой
    для вектора
    β
    Пример 4.2.1.
    В табл. 4.1 представлены данные, отражающие динамику курса акций некоторой компании (в условных едини- цах).
    Таблица 4.1
    i
    1 2
    3 4
    5 6
    7
    i
    y
    971 1166 1044 907 957 727 752
    i
    8 9
    10 11 12 13 14
    i
    y
    1019 972 815 823 1112 1386 1428
    i
    15 16 17 18 19 20 21
    i
    y
    1364 1241 1145 1351 1325 1226 1189
    Необходимо по этим данным построить модель AR(1), AR(2) и определить их значимость при уровне значимости
    0.05
    α
    =
    , а также построить полиномиальные тренды
    ( )
    t
    τ
    первого, второго порядка и проверить их значимость. Построить прогноз для
    22, 23
    i
    =
    Решение. Первоначально, используя команду Добавить ли-
    нию тренда (см. п. 2.2.1), определим коэффициенты уравнений: линейного тренда (
    1,
    p
    = 1 2
    m
    p
    = + = )
    0 1
    ( )
    ;
    t
    b
    b
    τ
    τ
    = +
    (4.2.6) квадратичного тренда (
    2,
    p
    =
    3
    m
    = )
    2 0
    1 2
    ( )
    t
    b
    b
    b
    τ
    τ
    τ
    = +
    +
    (4.2.7) и вычислим для каждого уравнения тренда значения величин
    2
    R ,
    2
    R , F по следующим формулам:
    132 2
    2 1
    2 1
    (
    )
    (
    ) (
    )
    1 1
    1
    (
    ) (
    )
    (
    )
    n
    i
    i
    T
    e
    i
    T
    n
    i
    i
    y
    y
    Q
    y Xb
    y Xb
    R
    Q
    y y
    y y
    y
    y
    =
    =



    = −
    = −
    = −





    ; (4.2.8)
    2 2
    1 1
    (1
    )
    n
    R
    R
    n m

    = −
    ⋅ −

    ;
    (4.2.9)
    (
    )
    (
    1)
    r
    e
    Q
    n m
    F
    Q
    m
    ⋅ −
    =


    ,
    (4.2.10) где
    i
    y – значение, вычисленное по модели временного ряда при
    i
    τ τ
    = , y – вектор размерности n, составленный из средних зна- чений
    1 1
    n
    i
    i
    y
    y
    n
    =
    =

    , а суммы
    ,
    e
    r
    Q Q определяются выражениями
    ( )
    2 2
    1
    (
    )
    n
    T
    T
    r
    i
    i
    Q
    b X y n y
    y
    y
    =
    =

    =


    ;
    2 1
    (
    )
    n
    T
    T
    T
    e
    i
    i
    i
    Q
    y y b X y
    y
    y
    =
    =

    =


    Значения
    2
    R ,
    2
    R , F и соответствующие уравнения трендов приведены в табл. 4.2.
    Таблица 4.2
    Уравнение тренда
    2
    R
    2
    R
    F
    Кван- тиль
    ( ) 854.66 21.52
    t
    τ
    τ
    =
    +
    (
    1,
    p
    =
    2
    m
    = )
    0.379 0.346 11.62 4.38 2
    ( ) 943.83 1.74 1.06
    t
    τ
    τ
    τ
    =

    +
    (
    2,
    p
    =
    3
    m
    = )
    0.406 0.373 12.99 3.55

    133
    Определим квантиль
    0.95;
    1;
    m
    m n
    F


    F-распределения по извест- ной формуле:
    0.95;
    1;
    FРАСПОБР(0.05;
    1;
    )
    m
    m n
    F
    m
    m n


    =

    − при 21
    n
    =
    . Значение квантиля, играющего роль границы крити- ческой области при проверке гипотезы о значимости построенной регрессии также приведены в табл. 4.2. Из этой табл. видно, что неравенство
    0.95;
    1;
    m
    m n
    F
    F


    >
    (4.2.11) выполняется как для линейного, так и для квадратичного тренда.
    Поэтому можно сказать, что построенные модели тренда значимы при уровне значимости 0.05.
    На рис. 4.1 нанесены значения временного ряда
    i
    y (отобра- жены маркерами в форме квадратов – кривая 1) и значения квад- ратичного тренда (кривая 2). Видно, что, несмотря на принятие гипотезы о значимости, уравнение тренда не отображает динами- ку рассматриваемого временного ряда, а представляет «усреднен- ную линию» его поведения. Поэтому перейдем к построению ав- торегрессионных моделей для этого временного ряда.
    Уравнение регрессии для модели AR(1), определенной выра- жением (4.1.7) имеет вид
    0 1
    1
    i
    i
    y
    b
    b y

    = +
    (4.2.12)
    Для вычисления коэффициентов
    0 1
    ,
    b b , которые являются оценка- ми для
    0 1
    ,
    β β
    модели (4.1.7) используем классический метод наи- меньших квадратов, реализованный в режиме Регрессия модуля
    Анализ данных [5, с. 94]. Вычисленные значения:
    0 280.90,
    b
    =
    1 0.746
    b
    =
    . Значения величин
    2
    R ,
    2
    R , F приведены в табл. 4.3
    (вторая строка).
    134
    Рис. 4.1. Графики значений ,
    i
    i
    y y (пример 4.2.1)
    Уравнение регрессии для модели AR(2), определенной фор- мулой (4.1.8) имеет вид
    0 1
    1 2
    2
    i
    i
    i
    y
    b
    b y
    b y


    = +
    +
    (4.2.13)
    Используя режим Регрессия модуля Анализ данных, вычис- ляем коэффициенты
    0 1
    2 275.61,
    0.730,
    0.022
    b
    b
    b
    =
    =
    =
    . В табл. 4.3 приведены значения
    2
    R ,
    2
    R , F для уравнения (4.2.13).
    Из табл. 4.3 видно: а) уравнения (4.2.12), (4.2.13) имеют существенно большие значения
    2
    R ,
    2
    R
    , F по сравнению с квадратичным трендом; б) уравнения (4.2.12), (4.2.13) при вычисленных коэффициен- тах
    0 1
    2
    , ,
    b b b являются значимыми при
    0.05
    α
    =
    и практически имеют одни и те же характеристики.

    135
    Таблица 4.3
    Модель авторегрессии
    2
    R
    2
    R
    F
    Кван- тиль
    1 280.90 0.746
    i
    i
    y
    y

    =
    +
    0.553 0.528 23.26 4.38 1
    2 275.61 0.730 0.022
    i
    i
    i
    y
    y
    y


    =
    +
    +
    +
    0.554 0.525 23.22 3.55
    Поэтому, исходя из принципа минимальной сложности, для прогнозирования значений временного ряда будет использоваться уравнение:
    1 280.90 0.746
    i
    i
    y
    y

    =
    +
    Для 22
    i
    =
    прогнозное значение
    22 280.90 0.746 1189 1168
    y
    =
    +

    =
    Для 23
    i
    =
    прогнозное значение
    23 22 280.90 0.746 280.90 0.746 1168 1152.
    y
    y
    =
    +
    =
    +

    =

    4.3. Оценивание коэффициентов авторегрессионной модели
    стационарного временного ряда
    Предположим, что рассматриваемый временной ряд
    ( )
    {
    }
    i
    Y
    τ
    представлен выборкой
    i
    y ,
    1, 2,...,
    i
    n
    =
    . Этот ряд является стацио- нарным с нулевым математическим ожиданием
    ( )
    (
    )
    0
    i
    M Y
    τ
    = ,
    1, 2,...,
    i
    n
    =
    (4.3.1)
    Если это условие не выполняется, то следует рассмотреть
    центрированные значения
    i
    i
    z
    y
    y
    =
    − , 1,2,...,
    i
    n
    =
    ,
    (4.3.2) где y – оценка (1.2.3) математического ожидания
    ( )
    (
    )
    i
    M Y
    τ
    136
    Обратимся к уравнению (4.1.1), в котором
    0
    β
    следует поло- жить равным 0 (из-за выполнения условия (4.3.1)):
    1 1
    2 2
    i
    i
    i
    p i p
    i
    y
    y
    y
    y
    β
    β
    β
    ε



    =
    +
    +
    +
    (4.3.3)
    Умножим левую и правую части на
    i m
    y

    и возьмем математиче- ское ожидание от получившихся произведений
    [
    ]
    [
    ]
    [
    ]
    [
    ]
    [
    ]
    1 1
    2 2
    i i m
    i
    i m
    i
    i m
    m
    i m i m
    i m i
    M y y
    M y y
    M y y
    M y
    y
    M y
    β
    β
    β
    ε








    =
    +
    +
    + +
    +
    +
    . (4.3.4)
    Так как случайные величины
    i
    ε
    удовлетворяют условию Гаусса–
    Маркова, то
    [
    ]
    0
    i m i
    M y
    ε

    = ,
    1,2,...
    m
    =
    (4.3.5)
    Далее в силу стационарности временного ряда
    [
    ]
    (
    )
    i k i m
    i i m k
    M y y
    M y y






    =

    ⎦ .
    (4.3.6)
    Обозначим ковариационный момент
    [
    ]
    k
    i i k
    M y y
    μ

    =
    (4.3.7) и с учетом (4.3.5), (4.3.6), (4.3.7) перепишем (4.3.4) в виде
    1 1
    2 2
    0
    m
    m
    m
    m
    k
    m k
    μ
    β μ
    β μ
    β μ
    β μ



    =
    +
    +
    + +
    ,
    1,2,...,
    m
    k
    =
    . (4.3.8)
    Величина
    [
    ]
    0
    m m
    M y y
    μ
    =
    есть дисперсия
    2
    y
    σ
    значений временного ряда и поэтому поделив левую и правую части (4.3.8) на
    2 0
    y
    σ
    μ
    =
    , получаем систему уравнений в терминах коэффициентов авто- корреляции:
    ( )
    (
    )
    (
    )
    (
    )
    1 2
    1 2
    ,
    1,2,..., .
    m
    k
    m
    m
    m
    m k
    m
    p
    ρ
    β ρ
    β ρ
    β
    β ρ
    =
    − +

    +
    + +
    +

    =
    (4.3.9)

    137
    Эта система содержит p уравнений относительно p неизвестных
    1 2
    ,
    , ,
    p
    β β
    β

    . Перепишем систему уравнений (4.3.9) в матричном виде
    β ρ
    ϒ = ,
    (4.3.10) где
    ϒ – матрица размера p p
    × имеет структуру
    ( )
    (
    )
    ( )
    (
    )
    (
    )
    1 1
    1 1
    1 1
    2 1
    p
    p
    p
    ρ
    ρ
    ρ
    ρ
    ρ

    ϒ =


    ,
    (4.3.11) а векторы
    β
    ,
    ρ
    состоят из
    β
    проекций
    1 2
    p
    β
    β
    β
    β
    =
    ,
    ( )
    ( )
    ( )
    1 2
    p
    ρ
    ρ
    ρ
    ρ
    =
    (4.3.12)
    Решая систему (4.3.10), вычисляем вектор
    β
    , а следователь- но, коэффициенты
    β
    1
    ,
    β
    2
    , …,
    β
    p
    , входящие в уравнение (4.3.3).
    К сожалению, на практике коэффициенты автокорреляции
    ( )
    m
    ρ
    , m = 1, 2, …, p точно вычислить нельзя и вместо них в мат- рицу
    ϒ и вектор
    ρ
    подставляют выборочные коэффициенты ав- токорреляции
    ( )
    r m , вычисляемые по формуле (1.2.5). В этом слу- чае приходим к системе уравнений
    Rb r
    = ,
    (4.3.13)
    138
    где
    ( )
    (
    )
    ( )
    (
    )
    (
    ) (
    )
    1 1
    1 1
    1 2
    1 2
    1
    r
    r p
    r
    r p
    R
    r p
    r p


    =


    ;
    ( )
    ( )
    ( )
    1 2
    r
    r
    r
    r p
    =
    ;
    1 2
    p
    b
    b
    b
    b
    =
    . (4.3.14)
    Эту систему уравнений часто называют уравнениями Юла–
    Уокера.
    Проекции
    1 2
    , , ,
    p
    b b
    b

    вектора b являются только оценками для коэффициентов
    β
    1
    ,
    β
    2
    , …,
    β
    p
    . Так как выборочные коэффици- енты автокорреляции ( )
    r l являются случайными величинами, то матрица R содержит случайные элементы (так же, как и матрица
    X (4.2.2)) и поэтому вектор b является уже смещенной оценкой для вектора
    β
    . Неэффективность оценки b может быть вызвана
    (при большом значении порядка p ) плохой обусловленностью матрицы R (т.е. матрица R имеет большое число обусловленно- сти).
    Напомним [5, с. 113], что числом обусловленности квадрат- ной обратимой матрицы R называется величина
    ( )
    1
    cond R
    R
    R

    =

    ,
    (4.3.15) где евклидова норма матрицы R определяется выражением
    1 2
    2
    ,
    1 1
    p
    p
    i j
    i
    j
    R
    r
    =
    =


    = ⎜



    ∑∑
    (4.3.16)
    Число обусловленности
    ( )
    cond R может изменяться от 1 до +

    (вырожденная матрица) и входит в неравенство
    ( )
    b b
    r r
    cond R
    b
    r



    ,
    (4.3.17)

    139 где b – решение системы Rb r
    = при неточно заданной правой части r . Следовательно, чем больше число обусловленности, тем больше относительная ошибка получаемого решения при неточно заданной правой части системы уравнений.
    1   2   3   4   5   6   7   8   9


    написать администратору сайта