Главная страница
Навигация по странице:

  • 11.2. Составляющие временного ряда тренд, сезонная, циклическая, случайная компоненты

  • Учебнометодическое пособие Москва Берлин 2020 удк 330. 43(075) ббк 65в631я7 з рецензенты


    Скачать 1.43 Mb.
    НазваниеУчебнометодическое пособие Москва Берлин 2020 удк 330. 43(075) ббк 65в631я7 з рецензенты
    Дата03.05.2022
    Размер1.43 Mb.
    Формат файлаpdf
    Имя файла92668_9b22712e71fd244eb1d3426f20a49e6b.pdf
    ТипУчебно-методическое пособие
    #510093
    страница5 из 6
    1   2   3   4   5   6
    Мультиколлинеарность
    Мультиколлинеарность — высокая взаимная коррелирован- ность экзогенных переменных. При мультиколлинеарности коэффициенты регрессии ненадежны и уравнение регрессии, как правило, не имеет реального смысла. Точных количественных критериев для обнаружения мульти- коллинеарности нет. Тем не менее, есть некоторые рекомендации по ее выявлению Анализируют матрицу парных коэффициентов корреляции
    (
    ту ее часть, которая относится к экзогенным переменным. Считается, что если в ней содержатся коэффициенты корреляции, превышающие по абсолютной величине значения 0,75–0,8, то это свидетельствует о присутствии мультиколлинеарности. Исследуют матрицу ( ′
    X X
    ). Если определитель матрицы det (

    X X ) или ее минимальное собственное значение близки к нулю, то это говорит о наличии мультиколлинеарности. О присутствии мультиколлинеарности свидетельствуют некоторые внешние признаки модели некоторые из коэффициентов имеют неверные с позиции экономической теории знаки или неоправданно большие значения;

    небольшое изменение исходных данных приводит к существенному изменению оценок модели
    при проверке с помощью критерия большинство коэффициентов регрессии оказываются статистически незначимы- ми, в то время как в действительности они имеют отличные от нуля значения, а модель в целом оказывается статистически значимой при проверке с помощью F-теста.
    Для уменьшения мультиколлинеарности используют следующие меры Увеличивают объем выборки, что позволяет получить
    МНК — оценки с меньшей дисперсией. Исключают переменные, которые высококоррелированы с остальными. При этом, какую переменную оставить, а какую убрать из анализа, решают на основании экономических соображений. Используют пошаговые процедуры отбора наиболее информативных переменных. Процедура введения новых переменных продолжается до тех пор, пока будет увеличиваться соответствующий коэффициент детерминации.
    9.2. Частная корреляция Если переменные коррелируют друг с другом, тона значении коэффициента корреляции сказывается влияние других переменных. Поэтому возникает необходимость исследования частной корреляции между переменными при исключении влияния одной или нескольких переменных. Частным коэффициентом корреляции между переменными (Хи (Х) при фиксированных значениях остальных (р – 2) переменных называется выражение
    1,2,3...
    =
    ij
    ij
    p
    ii
    jj
    g
    r
    g где и
    jj
    g
    — алгебраические дополнения элементов и матрицы выборочных коэффициентов корреляции
    




    




    =
    1 1
    1 2
    1 2
    21 1
    12
    p
    p
    p
    p
    p
    r
    r
    r
    r
    r
    r
    g
    59
    Если число переменных n = 3, то
    (
    )(
    )
    ,
    2 2
    1 1

    =


    ij
    ik jk
    ij k
    ik
    jk
    r
    r r
    r
    r
    r
    9.
    3. Линейные регрессионные модели с переменной структурой. Фиктивные переменные На практике часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (образование, пол, сезонность и т. д. Качественные признаки влияют на структуру линейных связей между переменными и приводят к скачкообразному изменению параметров регрессионной модели. В этом случае строится регрессионная модель с переменной структурой. Построение модели с переменной структурой предполагает введение в нее фиктивных переменных или манекенов. Фиктивные переменные вводятся в регрессионную модель для отражения влияния на эндогенную переменную у) сопутствующих качественных переменных. В качестве фиктивных переменных используют бинарные переменные, которые принимают только одно из двух значений — «0» или «1». В практике исследователя возникают случаи, когда имеются две выборки пар значений зависимой и объясняющей переменных и необходимо выяснить, возможно ли объединение двух выборок в одну и исследование единой модели регрессии (Y) по (Х. Для ответа на этот вопрос служит тест (критерий) Г. Чоу. Согласно данному тесту по каждой выборке строятся две линейные регрессионные модели
    1 1
    0 1
    1 2
    1 1, 2, ...
    1, ...
    =
    =



    = β +
    β
    +
    =
    ′′
    ′′
    ′′
    = β +
    β
    +
    = +
    +


    p
    i
    o
    j
    ij
    j
    p
    i
    j
    ij
    i
    j
    y
    x
    e
    i
    n
    y
    x
    e
    i
    n
    n
    n
    60
    Проверяемая нулевая гипотеза имеет вид
    ( )
    2 0
    : ′
    ′′
    ′′
    β = β
    =
    = σ
    H
    D
    D где и

    ′′
    β
    β — векторы параметров двух моделей
    ,
    ′ ′′
    e e — их случайные возмущения. Если нулевая гипотеза верна, то две регрессионные модели можно объединить в одну объема
    1 2
    +
    =
    n
    n
    n
    0 1
    ;
    1...
    =
    = β +Нулевая гипотеза (Н) отвергается на уровне значимости (α), если статистика
    (
    )
    (
    )
    1 2
    2 2
    1 1
    1 1
    2 2
    1 1
    2 2
    ( ,
    1,
    2 2)
    1)
    =
    =
    =
    =
    =










    =
    >
    α +




    +
    +









    n
    n
    n
    i
    i
    i n
    n
    n
    i
    i n
    e i
    e i
    e i
    n
    p
    F
    F
    p
    n
    p
    e i
    e i
    p
    , где
    1 2
    2 2
    1 1
    1
    =
    =
    =



    n
    n
    n
    i
    i
    i n
    e i
    e i
    e i
    — остаточные суммы квадратов соответственно для объединенной, первой, второй выборок. Контрольные вопросы к теме № 9 Что такое мультиколлинеарность.
    2.
    По каким признакам можно обнаружить мультиколлине- арность. Каким образом можно уменьшить мультиколлинеарность.
    4.
    В каких случаях используются модели с переменной структурой. Что такое фиктивные переменные.
    6.
    Какое влияние оказывают фиктивные переменные на оценку модели. Для чего служит критерий (тест) Г. Чоу.
    8.
    Что позволяет исследовать частный коэффициент корреляции Задача 9.1. С целью исследования влияния факторов Х — среднемесячного количества профилактических наладок автоматической линии и Х
    — среднемесячного числа обрывов нити на показатель
    Y
    — среднемесячную характеристику качества ткани в баллах) поданным предприятий легкой промышленности были вычислены парные коэффициенты корреляции ry
    1
    = 0,
    105,
    ry
    2
    =
    0.024, r
    12
    = 0,
    996. Оценить частные коэффициенты корреляции и и оценить их значимость на ном уровне. Задача 9.2. Для исследования зависимостимежду производительностью труда Х, возрастом Хи производственным стажем Х была произведена выборка из 100 рабочих одной и той же специальности. Вычисленные парные коэффициенты корреляции оказались значимыми и составили r12 = 0.2, r13 = 0.41. r23 = 0.82. Вычислить частные коэффициенты корреляции и оценить их значимость на уровне α =0,05. Задача Для линейного трехфакторного уравнения регрессии А+ АХАХ+ АХ +Е =1, 2, ..., Т) имеются данные Х 14,6 11,4 17,1 10,6 Х 28 23 30,5 21,7 Х 20,3 9,8 8,
    1 17,7
    Y
    t
    40 80 55 58 70 Требуется
    1. Определить корреляционную матрицу (R) и содержащийся в этих данных размер коллинеарности как det(R).
    2. Рассчитать размер коллинеарности, в случае если из уравнения выводится переменная (Х. Задача Для переменной « заработная плата представлена модель Y
    t
    = А+ АХ +
    А
    2
    Х
    2t
    +Е
    t
    , где Y
    t
    — логарифм совокупной заработной платы Х — количество лет обучения Х — опыт работы. Выборка составлена таким образом, что номера от 1 до 100 соответствуют женщинам, а со 101 по 300 — мужчинам.
    62
    Требуется
    1. Предложить два способа представления нулевой гипотезы,
    что заработная плата мужчины для данного уровня образования и опыта работы выше, чему женщины с такими же характеристиками
    2. Проверить гипотезу, что коэффициенты уравнений типа, построенных отдельно для подвыборок мужчин и женщин, совпадают. Известно, что в модели для женщин сумма квадратов остатков равна 0,13, а для мужчин 0,33. Оценка МНК по всей выборке дает сумму квадратов остатков 0,6.
    ТЕМА № 10 НЕЛИНЕЙНЫЕ МОДЕЛИ РЕГРЕССИИ И ИХ ЛИНЕАРИЗАЦИЯ План Два подхода для оценки параметров нелинейных моделей.
    2.
    Нелинейные модели регрессии. Два подхода для оценки параметров нелинейных моделей Соотношение между социально-экономическими явлениями и процессами не всегда можно выразить линейными функциями. Примерами нелинейных зависимостей являются зависимость между объемом продукции и факторами производства, между спросом на товар и ценой и т.д. Для оценки параметров нелинейных моделей используют два подхода Попытка подобрать такое преобразование к анализируемым переменным, которое позволило бы представить существующую зависимость в виде линейной функции (линеаризация модели. Если линеаризация невозможна, то тогда к исследуемой зависимости применяют методы нелинейной регрессии (нелинейная оптимизация.
    10.2. Нелинейные модели регрессии Линеаризации поддаются следующие зависимости Экспоненциальная 0
    β +
    = β
    x Ее можно представить в линейном виде путем преобразований
    0 1
    0 0
    ln ln




    = β + β +
    β = β
    =
    y
    x
    u
    y
    y
    64
    Логарифмическая 1
    ln
    = β + β
    +
    y
    X
    u . Переход к линейной зависимости осуществляется с помощью преобразования экзогенной переменной Гиперболическая 1
    1
    = β + Приводится к линейному виду с помощью преобразования экзогенной переменной В результате получим линейную модель вида
    0 1

    = β + β
    +
    y
    x
    u . Степенная 0
    β
    = β
    y
    x . Для перехода к линейной модели нужно произвести логарифмирование обоих частей уравнения
    0 1
    log log log
    =
    β + β
    y
    x . Обозначим
    0 0
    log log log



    =
    β =
    β
    =
    y
    y
    x
    x , получим линейную модель
    0 1



    = β + β
    y
    x . Показательная 1
    = β + Для перехода к линейной модели нужно произвести логарифмирование обоих частей уравнения
    0 1
    log log log
    =
    β +Обозначим
    0 0
    1 1
    log log log



    =
    β =
    β
    β =
    β
    y
    y
    , получим линейную модель
    0 1



    = β + β
    y
    x
    65
    Контрольные вопросы к теме № 10 Что делать, если исследуемая функция регрессии нелинейная. Какие виды нелинейных зависимостей поддаются линеаризации ТЕМА № 11 ХАРАКТЕРИСТИКИ ВРЕМЕННЫХ РЯДОВ План Временной ряди этапы его анализа.
    2.
    Составляющие временного ряда тренд, сезонная, циклическая, случайная компоненты.
    3.
    Аналитическое выравнивание временного ряда.
    Прогнозирование на основе моделей временного ряда. Временной ряди этапы его анализа Временной ряд представляет собой последовательность наблюдений некоторого признака (Y) в последовательные моменты времени. Анализ временных рядов базируется наследующей идее результирующая переменная
    (Y) складывается под влиянием большого числа факторов, многие из которых не поддаются идентификации и непосредственному наблюдению и измерению. Поэтому лучшим источником информации о совокупности влияния всех этих факторов являются значения самой исследуемой переменной (Y) в прошлые моменты времени, а также текущие и прошлые значения случайных ошибок. Основное прикладное значение моделей временных рядов состоит в прогнозировании экономических показателей. Использование временных рядов позволяет строить кратко- и среднесрочные экономические прогнозы, которые используются при решении следующих задач планирование в производстве и торговле;

    управление и оптимизация социально-экономических процессов в обществе частичное управление важными параметрами демографических процессов принятие решений в бизнесе.
    Выделяют основные этапы анализа временного ряда:

    графическое представление и описание поведения временного ряда выделение и удаление закономерных составляющих временного ряда (U
    t
    , C
    t
    , V
    t
    );
    67


    сглаживание и фильтрация (удаление низко- или высокочастотных составляющих временного ряда

    исследование (E
    t
    ), построение и проверка адекватности модели для ее описания

    прогнозирование развития изучаемого процесса на основе имеющегося временного ряда

    исследование взаимосвязи между различными временными рядами.
    11.2. Составляющие временного ряда тренд, сезонная, циклическая, случайная компоненты
    Y
    t
    = U
    t
    + V
    t
    + C
    t
    + E
    t
    ,(t = 1, 2, …, где U
    t

    тренд, плавно меняющаяся компонента, описывающая длительную тенденцию изменения анализируемого показателя
    V
    t
    — сезонная компонента, отражающая повторяемость экономических процессов в течении не очень длительного периода (год, месяц, неделя
    C
    t
    — циклическая компонента, отражающая повторяемость экономических процессов в течении длительных периодов
    E
    t
    — случайная компонента, отражающая влияние неподдающихся учету и регистрации случайных факторов.
    11.3. Аналитическое выравнивание временного ряда. Прогнозирование на основе моделей временного ряда Распространенными методами анализа временного ряда являются корреляционный, спектральный анализ, модель авторегрессии и скользящей средней, речь о них пойдет в следующих темах. Важнейшей задачей при исследовании временного ряда является выявление основной тенденции изучаемого процесса, выраженной неслучайной составляющей Y(t) (U
    t
    , V
    t
    , C
    t
    )
    . Для решения этой задачи прежде всего необходимо выбрать вид функции f(t). Часто используются следующие функции

    линейная
    =
    t
    y
    bt ;
    68
    полиномиальная 0
    1
    = +
    + +

    m
    t
    m
    y
    b
    b t
    b t ; экспоненциальная b
    ; степенная t
    ; гиперболическая +При выборе функции f(t) используют содержательный анализ устанавливающий характер динамики процесса, визуальные наблюдения (на основе графического изображения временного ряда. Предпочтение следует отдавать более простым функциям. Для выявления основной тенденции временного ряда применяют МНК. При этом значения временного ряда рассматриваются эндогенная переменная, а время (t) как экзогенная
    ( )
    = ϕ +
    t
    t
    y
    t
    e , где
    t
    e — возмущения, удовлетворяющие основным предпосылкам регрессионного анализа. Если функция ( )
    ϕ t линейная, то согласно МНК, уравнение регрессии можно представить
    (
    )
    1 1
    ˆ
    1
    ;
    ,
    2
    =
    =
    − =

    +
    =
    =
    =


    t
    n
    n
    t
    i
    i
    y
    y
    b а коэффициент регрессии
    ( )
    1
    b найти по формуле
    69

    ( )
    1 2
    2
    − ×
    =

    t
    t
    y t
    y
    t
    b
    t
    t
    ,
    (
    )
    (
    )(
    )
    1 1
    2
    ;
    ;
    1 1 2 1
    ;
    2 6
    =
    =
    =
    =
    +
    +
    +
    =
    =


    n
    n
    t
    t
    t
    t
    t
    t
    y t
    y
    y В случае если функция ( )
    ϕ t нелинейная, то можно применить методы линеаризации или специальные процедуры оценивания. Другим методом выявления основной тенденции временного ряда является метод скользящих средних. Он основан на переходе от начальных значений членов ряда к их средним значениям на интервале времени, длина которого определена заранее. Для усреднения могут быть использованы средняя арифметическая, медиана и др. Одна из важных задач анализа временного ряда состоит в прогнозировании на его основе развития изучаемого процесса. Задача формулируется так имеется временной ряди требуется дать прогноз уровня этого ряда на момент п + τ . Если рассматривать временной ряд как регрессионную модель изучаемого признака попеременной время, ток нему можно применить рассмотренные в темах № 3, 4 методы анализа. Следует только помнить, что основной предпосылкой регрессионного анализа является независимость возмущения
    t
    e
    (1, 2, … n
    ) и
    ( )
    0
    =
    t
    M e
    , то есть соблюдаются условия нормальной классической регрессионной модели. Контрольные вопросы к теме № 11

    1.
    Что такое анализ временных рядов.
    2.
    Каковы области практического применения анализа временных рядов.
    3.
    Каковы основные компоненты, составляющие временной ряд.
    4.
    Назовите основные этапы анализа временных рядов.
    5.
    Назовите методы выявления основной тенденции развития изучаемого процесса.
    70
    Какие функции используют при выявлении основной тенденции изучаемого процесса. Задача 11.1. В таблице приведены данные, отражающие спрос на товар за восьмилетний период Год, t
    1 2
    3 4
    5 6
    7 8 Спрос, усл. ед.
    213 171 291 309 317 362 351 361 Найти уравнение тренда для временного ряда Y
    t
    , полагая тренд линейным, проверить значимость уравнения тренда по F — критерию на ном уровне значимости. Задача 11.2. Проверить сглаживание временного ряда поданным задачи 11.1 методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания m = 3 года. Задача 11.3. Поданным задачи 11.1 дать точечную и с надежностью интервальную оценки прогноза среднего и индивидуального значений спроса на товар на момент t = 9 (девятый год.
    Тренд линейный, возмущения удовлетворяют требованиям классической модели. Задача 11.4. В таблице представлены данные, отражающие динамику роста доходов надушу населения (Y
    t
    )
    (ден. ед) за восьмилетний период
    T
    1 2
    3 4
    5 6
    7 8
    Yt
    1133 1222 1354 1389 1342 1377 1491 1684 Полагая, что тренд линейный и условия классической модели выполнены а) найти уравнение тренда и оценить его значимость на уровне 0,05;
    71
    в) дать точечный и с надежностью 0,95 интервальный прогнозы среднего и индивидуального значений доходов на девятый год. Задача 11.5. Имеются следующие данные об урожайности озимой пшеницы (Y
    t
    ) (ц/га) залет Требуется найти а) найти уравнение тренда, полагая, что он линейный в) провести сглаживание тренда временного ряда (Y) методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания 1) m = 3; 2) m =5.
    ТЕМА № 12 МОДЕЛИ СТАЦИОНАРНЫХ И НЕСТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ, ИХ ИДЕНТИФИКАЦИЯ План Стационарные временные ряды и их характеристики.
    2.
    Авторегрессионные модели и модели скользящей средней.
    3.
    Нестационарные временные ряды. Стационарные временные ряды и их характеристики Стационарный временной ряд это такой ряд, который имеет постоянную среднюю, а значения ряда колеблются вокруг этой средней с некоторой постоянной дисперсией. Различают строго стационарный и слабо стационарный временной ряд. Ряд
    ( )
    t
    x называется строго стационарным, если совместное распределение вероятностей m наблюдений
    (
    )
    1 такое же как и для m наблюдений
    (
    )
    1 2
    ,
    ,
    ,




    m
    t
    t
    t
    x
    x
    x
    , для любых m,
    (
    )
    1 2
    , ,
    ,

    m
    t и
    ( )
    τ
    , то есть закон распределения и числовые характеристики такого ряда не зависят от (t). Ряд
    ( )
    t
    x называется слабо стационарным, если он имеет постоянные математическое ожидание, дисперсию и автоковариацию
    (
    ковариацию, измеренную для различных значений одного итого же временного ряда, то есть для него выполняются условия
    (
    )
    [
    ]
    2 1
    2 2
    1 1.
    ( )
    2.
    (
    )
    3.
    (
    )(
    )

    = η

    − η
    − η  = σ



    − η
    − η = γ

    t
    t
    t
    t
    t
    t
    t
    M y
    M
    y
    y
    M
    y
    y
    73

    Автоковариация определяется соотношением
    [
    ]
    (
    )(
    )


    − η
    − η
    t
    t
    t s
    t s
    M
    y
    y
    , где
    ( )
    t
    y
    — слабо стационарный процесс,
    ( )
    = η
    t
    M y
    ,
    η и
    2 2
    (
    )


    − η
    = для всех (t). Пусть
    1 1
    =
    =

    n
    t
    t
    t
    y
    y
    n
    — средняя повремени. Если
    ( сходится по вероятности к
    ( )
    η при → ∞
    n
    , то говорят, что ряд
    ( обладает свойством эргодичности по отношению к средней. Математическое ожидание и дисперсия стационарного временного ряда оцениваются по формулам
    (
    )
    1 2
    2 Простейшим примером стационарного временного ряда является белый шум Белый шум — стационарный временной ряд, обладающий следующими свойствами
    2 2
    1.
    ( )
    ;
    2. ( )
    ;
    ,
    3.
    0 ,
    −τ
    = η
    = σ


    σ
    =
    γ = 




    t
    t
    t
    M y
    D Это значит, что белый шум имеет постоянное математическое ожидание и дисперсию, а случайные величины, соответствующие наблюдениям процесса белого шума в разные моменты времени, некоррелированы. Степень тесноты связи между наблюдениями временного ряда
    (
    )
    1 2
    ,
    ,
    ,

    n
    Y и
    (
    )
    1 2
    ,
    ,
    ,




    n
    Y
    Y
    Y
    , то есть сдвинутых относительно
    74
    друг друга лагом
    ( )
    τ
    , может быть определена с помощью коэффициента корреляции
    (автокорреляции):
    [
    ]
    [
    ]
    2
    (
    )(
    )
    (
    )(
    )
    ,
    ( )
    (
    )
    ( )
    (
    )
    ;
    ( )
    (
    )
    t
    t
    t
    t
    r
    x
    x
    t
    t
    y
    y
    M
    y
    a y
    a
    M
    y
    a y
    a
    p
    t
    t
    M y
    M y
    a
    t
    t







    =
    =
    σ
    × σ
    + τ
    σ
    =
    =
    σ
    = σ
    + τ = Зависимость называют автокорреляционной функцией. Статистической оценкой
    ( является выборочный коэффициент автокорреляции
    (
    )
    ( )
    τ
    r
    , определяемый по формуле
    1 1
    1 2
    2 2
    2 1
    1 1
    1
    (
    )
    ( )
    (
    )
    (
    )
    (
    )
    (
    )
    −τ
    −τ
    −τ


    =
    =
    =
    −τ
    −τ
    −τ


    =
    =
    = +τ
    =
    − τ

    τ =
    − τ

    ×
    − τ


    ∑ ∑




    n
    n
    n
    t
    t
    t
    t
    t
    t
    t
    n
    n
    n
    n
    t
    t
    t
    t
    t
    t
    t
    t
    n
    y Функцию
    (
    )
    ( называют выборочной автокорреляционной функцией При исследовании временных рядов рассматривают также
    частную автокорреляционную функцию
    ( )
    τ
    част
    р
    , где
    )
    (
    τ
    част
    р
    есть частный коэффициент корреляции между членами временного ряда
    ( )
    t
    y
    ,
    τ
    +
    t
    y
    , и ее статистическую оценку — выборочную частную автокорреляционную функцию
    ( част, где
    ( част — выборочный частный коэффициент корреляции, определяемый по формуле
    (
    )(
    )
    2 2
    1 1
    ij
    ik
    jk
    ik
    jk
    r
    r
    r
    r
    r
    r
    − При определении наличия автокорреляции между соседними членами временного ряда используется следующая связь коэффициента Дарбина — Уотсона с выборочным коэффициентом корреляции.

    1   2   3   4   5   6


    написать администратору сайта