Главная страница
Навигация по странице:

  • Оценка параметров моделей с распределенными лагами.

  • Оценка моделей с бесконечным числом распределенных лагов.

  • Учет качественных параметров в регрессионном анализе

  • 1. Переменные сдвига 1.1. Пример №1: модель с одной фиктивной переменной.

  • Табл. 1. Информация об аналогах для Примера №1 №, п./п. Дата Кол-во комнат Район Этаж Этаж- ность

  • Табл. 2. Средние значения Этаж Показатель Удельная цена, руб./ кв. м

  • Среднее 43 499 Средние этажи Минимальное значение 43 750 Максимальное значение 50 000 Среднее 46 736

  • Среднее 44 983

  • Y = a 1 *X 1 + с (модель №1)

  • Y = a 2 *X 2 + с (модель №2)

  • Табл. 3. Результаты регрессионного анализа Модель a 1 a 2 С R 2 Модель №1 Y=a 1 *X

  • Модель №3 Y=a 1 *X 1 +a 2 *X 2

  • Модели с лаговыми переменными


    Скачать 3.63 Mb.
    НазваниеМодели с лаговыми переменными
    Дата20.04.2023
    Размер3.63 Mb.
    Формат файлаpdf
    Имя файлаilovepdf_merged.pdf
    ТипДокументы
    #1076844
    страница1 из 6
      1   2   3   4   5   6

    Модели с лаговыми переменными
    В случае, когда объясняемая (зависимая) переменная связана не только со значениями объясняющих (независимых) переменных в текущий момент времени, но и со значениями объясняющих и самой объясняемой переменной в предыдущие моменты времени, строятся модели с запаздыванием, или модели с лаговыми переменными.
    Объясняющие и объясняемая переменные с запаздыванием называются
    лаговыми переменными. Величина запаздывания – лагом.
    Модели регрессии по временным рядам с лаговыми переменными принято называть динамическими моделями. Их можно разделить на три класса.
    1. Модели, включающие лаговые объясняющие переменные – модели с распределенным лагом,
    2. Модели, включающие лаговые объясняемые переменные – модели авторегрессии.
    3. Модели, включающие лаговые как объясняющие так и объясняемые переменные – авторегрессионные модели с распределенным лагом.
    Основной вопрос при построении динамических моделей – выбор величины лага и количества лаговых переменных.
    Для решения поставленного вопроса строится корреляционная функция. В модель можно включить переменные с величиной лагов, соответствующими порядку всех значимых коэффициентов автокорреляции, любо переменную с лагом, соответствующим максимальному по модулю значимому коэффициенту автокорреляции.
    При оценке параметров динамических моделей нельзя применять классический метод наименьших квадратов в силу мультиколлинеарности значений объясняющих переменных.
    Оценка параметров моделей с распределенными лагами.
    Рассмотри модель с конечным числом лагов
    t
    p
    i
    i
    t
    i
    t
    t
    x
    x
    y











    1 0
    Для оценки параметров модели применяется метод Алмон (предложен в 1965г.
    Ш.Алмон).
    Параметры оцениваются в предположении их полиномиальной зависимости от величины лага









    k
    j
    j
    j
    k
    k
    i
    i
    c
    i
    c
    i
    c
    i
    c
    c
    b
    0 2
    2 1
    0
    . (*)
    После подстановки представления
    i
    b
    в исходную модель и ее преобразования

     

     









































    k
    j
    j
    j
    k
    j
    j
    p
    i
    j
    i
    t
    p
    i
    i
    t
    p
    i
    i
    t
    k
    j
    j
    j
    t
    p
    i
    i
    t
    i
    t
    t
    z
    c
    z
    c
    a
    c
    i
    x
    x
    c
    a
    x
    i
    c
    x
    c
    a
    x
    b
    x
    b
    a
    y
    1 0
    0 1
    1 0
    0 1
    0 0
    1 0
    получаем модель с новыми переменными
    j
    z
    , представляющими собой линейную комбинацию исходных переменных. В матричном виде модель принимает вид
    








    











    k
    k
    k
    p
    p
    p
    H
    Zc
    XHc
    Y
    3 1
    9 3
    1 2
    1 0
    4 2
    1 1
    1 1
    0 0
    1
    ,
    2
    где
    Н – матрица весов при лаговых коэффициентах
    i
    с
    ;
    с – вектор коэффициентов при переменных
    j
    z
    ,
    XH
    Z

    Далее оценка вектора осуществляется по методу наименьших квадратов
    Y
    Z
    Z
    Z
    c
    T
    T



    1
    )
    (
    . Оценка параметров
    i
    b осуществляется по формулам (*).
    Оценка моделей с бесконечным числом распределенных лагов.
    Для оценки параметров модели вида
    t
    i
    i
    t
    i
    t
    t
    x
    x
    y












    1 0
    предполагается, что коэффициенты
    i
    b
    представляют собой убывающую геометрическую прогрессия со знаменателем

    и первым членом
    0
    b
    , т.е.
    i
    i
    b
    b



    0
    Рассмотрим модель

    t
    i
    i
    t
    i
    t
    t
    x
    x
    y













    1 0
    0
    (**) тогда
    t
    i
    i
    t
    i
    t
    t
    x
    x
    y
















    1 1
    0 1
    0 1
    (***)
    Умножим последнее уравнение (***) на

    :
    t
    i
    i
    t
    i
    t
    i
    i
    t
    i
    t
    t
    x
    x
    x
    y
    


    
    


    
    




















    1 0
    1
    )
    1
    (
    1 0
    1 0
    1
    и вычтем почленно из уравнения (**), получим
    )
    1
    (
    )
    1
    (
    0 1













    t
    t
    t
    t
    x
    y
    y
    или
    t
    t
    t
    t
    x
    y
    y









    0 1
    , где
    )
    1
    (





    ,
    )
    1
    (





    t
    t
    Далее оцениваем параметры полученной модели по методу наименьших квадратов

    1
    А.А. Марчук
    Русская Служба Оценки (
    www.rusvs.ru
    )
    Учет качественных параметров в регрессионном анализе
    Применение статистики в оценке имущества является одной из наиболее «модных» тем в оценочном сообществе. Статистические процедуры, давно известные математикам и специалистам по эконометрике, могут быть полезны оценщику, позволяя сделать расчеты более надежными и обоснованными. Развитие информационной открытости рынков, унификация баз данных, давно обсуждаемый доступ оценщиков к данным регистрирующих органов и т.п., безусловно, потребуют от оценщиков применение самых современных способов обработки и интерпретации информации.
    Одним из наиболее эффективных и полезных для оценщика статистических инструментов является регрессионный анализ. Регрессионный анализ позволяет выявить ценообразующие факторы и определить вид зависимости. Но при применении данного инструмента оценщики сталкиваются с целым рядом проблем (недостаточное число аналогов, недоступность информации по объектам- аналогам, волатильность рынков и другие). Эта статья посвящена проблеме учета качественных параметров при построении регрессионных зависимостей.
    Параметры, описывающие характеристики того или иного объекта оценки, можно разделить на два типа: количественные и качественные. Количественные параметры – параметры, значения которых выражаются числом. Примерами таких параметров могут выступать, например, площадь объекта, мощность двигателя, выручка компании и т.п.
    Но описать полностью тот или иной объект только количественными параметрами удается далеко не всегда. Существенная часть характеристик оцениваемых объектов носит качественный характер, т.е. описываются качественными параметрами. Значение качественной переменной выражается текстовым описанием, рисунком или каким-либо другим поясняющим его смысл способом. Измерить качественные параметры при помощи числовой шкалы невозможно. Примерами таких переменных могут выступать класс объекта, материал изготовления, тип привода, район расположения объекта и т.п.
    Учет качественных параметров при регрессионном анализе возможен различными способами.
    Наиболее простое решение – построение индивидуальных моделей для каждого значения (градации) качественного параметра. На первый взгляд такое решение является крайне эффективным – чем меньше параметров учитывается в модели, тем проще решение задачи. Но, на самом деле, такое решение далеко не всегда самое лучшее. Представьте, что для оценки объекта необходимо будет подобрать аналоги, удовлетворяющие следующим критериям: однокомнатные квартиры, расположенные на первом этаже в домах типа «хрущевка» в определенном районе города, внутри жилого квартала и с отделкой определенного уровня. Даже на развитом рынке (например, рынок жилья городов-миллионников) поиск аналогов, удовлетворяющих столь жестким требованиям, скорей всего, не увенчается успехом. Кроме того, с уменьшением количества аналогов надежность оценок коэффициентов модели существенно снижается, а погрешность полученной модели, соответственно, возрастает.
    Альтернативным вариантом является учет качественных параметров в модели, для чего используются фиктивные переменные (в литературе также встречается термин «переменные – манекены»). Данный способ является более эффективным, т.к. появляется возможность оценить статистическую значимость влияния данного фактора на зависимую переменную на фоне других параметров, включенных в модель, и повысить надежность модели за счет включения большего количества аналогов.
    Фиктивная переменная (dummy variable) — в эконометрике переменная модели, полученная путем преобразования (напр., с помощью балльных оценок) информации, содержащей качественные и другие не поддающиеся числовой оценке величины. Ф. п. используются как простое средство для включения подобной информации в регрессионный анализ. Напр., добавление Ф. п., принимающей только два значения — 0 и 1 в качестве дополнительной объясняющей переменной, часто используется при анализе сезонных колебаний. [1]

    2
    Фиктивные переменные подразделяются на переменные сдвига и переменные наклона. Выбор в пользу того или иного типа переменных (или их комбинаций) является «содержательной» задачей и зависит от характера используемых в модели параметров. Далее продемонстрированы особенности данных видов переменных на нескольких примерах.
    1. Переменные сдвига
    1.1. Пример №1: модель с одной фиктивной переменной.
    Рассмотрим самый простой случай регрессии – учтем в модели только одну, качественную переменную. Данный пример является упрощенным вариантом применения регрессионного анализа и предназначен для демонстрации сути фиктивных переменных.
    В нижеследующей таблице представлены данные по ценам предложения однокомнатных квартир одного типа (панельные 5-ти этажные дома), расположенные в центральном районе г. Архангельска
    1
    Табл. 1. Информация об аналогах для Примера №1
    №,
    п./п.
    Дата
    Кол-во
    комнат
    Район
    Этаж
    Этаж-
    ность
    Площадь
    общая,
    кв. м
    Жилая
    площадь,
    кв. м
    Кухня,
    кв. м
    Тип
    дома
    Удельная
    цена,
    руб./кв. м
    «Сред-
    ний
    этаж»
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    1 20.06.09 1
    Центр
    1 5
    31,3 18,2 6 пан.
    41 534 0
    2 16.05.09 1
    Центр
    1 5
    31 18 6 пан.
    41 613 0
    3 25.09.09 1
    Центр
    1 5
    31 18 6,5 пан.
    41 613 0
    4 16.10.09 1
    Центр
    5 5
    31 17,5 6 пан.
    41 935 0
    5 13.11.09 1
    Центр
    5 5
    30,7 17 5,6 пан.
    42 345 0
    6 15.08.09 1
    Центр
    1 5
    31 17 5 пан.
    42 903 0
    7 13.11.09 1
    Центр
    5 5
    31 17,5 5,7 пан.
    43 548 0
    8 23.10.09 1
    Центр
    1 5
    30 17,5 5,5 пан.
    45 000 0
    9 20.11.09 1
    Центр
    5 5
    30 18 5,6 пан.
    45 000 0
    10 16.05.09 1
    Центр
    1 5
    29,3 17,5 6,1 пан.
    45 000 0
    11 20.11.09 1
    Центр
    1 5
    30 16,4 6,3 пан.
    45 000 0
    12 02.10.09 1
    Центр
    1 5
    30 18 6 пан.
    45 000 0
    13 01.08.09 1
    Центр
    5 5
    30,2 17,4 5,4 пан.
    45 000 0
    14 11.09.09 1
    Центр
    3 5
    32 18 6 пан.
    43 750 1
    15 19.09.09 1
    Центр
    3 5
    30,5 18,6 5,4 пан.
    44 262 1
    16 16.10.09 1
    Центр
    3 5
    31 18,5 6 пан.
    44 839 1
    17 28.08.09 1
    Центр
    4 5
    31 18 5 пан.
    45 161 1
    18 02.10.09 1
    Центр
    4 5
    31 17 6,7 пан.
    45 161 1
    19 13.11.09 1
    Центр
    3 5
    30,4 16,6 6,3 пан.
    46 053 1
    20 09.10.09 1
    Центр
    2 5
    32 17 6 пан.
    46 875 1
    21 30.10.09 1
    Центр
    2 5
    30 17,1 5,4 пан.
    48 333 1
    22 19.09.09 1
    Центр
    2 5
    30 17,1 5,4 пан.
    49 667 1
    23 16.10.09 1
    Центр
    2 5
    30 17 5,6 пан.
    50 000 1
    24 09.10.09 1
    Центр
    4 5
    31 18 6 пан.
    50 000 1
    Как видно из таблицы, объекты достаточно однородны по площади, расположены в одном районе.
    При этом аналоги №№1…13 расположены на крайних этажах, 14-24 – на средних этажах.
    Общеизвестный факт, что квартиры на крайних этажах обычно стоят дешевле аналогичных квартир на средних этажах. Анализ данных, представленных в Табл. 1, это подтверждает – см. Табл. 2.
    1
    Данные предоставлены Агентством недвижимости «Троицкий Дом» (г. Архангельск, www.3dom.ru
    )

    3
    Табл. 2. Средние значения
    Этаж
    Показатель
    Удельная цена, руб./ кв. м
    Крайние этажи
    Минимальное значение
    41 534
    Максимальное значение
    45 000
    Среднее
    43 499
    Средние этажи
    Минимальное значение
    43 750
    Максимальное значение
    50 000
    Среднее
    46 736
    По всей выборке
    Минимальное значение
    41 534
    Максимальное значение
    50 000
    Среднее
    44 983
    Учтем различие «крайний этаж» / «средний этаж» при построении модели, для чего введем фиктивную переменную X
    1
    («Средний этаж», см. колонку 12 в Табл. 1), которая будет принимать следующие значения:
    X
    1
    = 1 для квартир, расположенных на средних этажах;
    X
    1
    = 0 для квартир, расположенных на крайних этажах.
    Искомая модель будет иметь вид:
    Y = a
    1
    *X
    1
    + с
    (модель №1)
    где:
    Y
    - удельная стоимость;
    X
    1
    - фиктивная переменная «Средний этаж»; a
    1
    - коэффициент модели; с
    - константа.
    Полученные результаты представлены в Табл. 3 (строка №1). Сопоставляя Табл. 2 и Табл. 3 легко заметить, что константа модели «c» равна среднему значению удельной стоимости квартир, расположенных на крайних этажах, а коэффициент при фиктивной переменной «Средний этаж» равен разнице между средними удельными стоимостями квартир на средних и крайних этажах:
    a
    1
    = 46 736 - 43 499 = 3 237
    Фактически коэффициент при фиктивной переменной «Средний этаж» отвечает на вопрос:
    «На сколько в среднем квартиры на средних этажах дороже квартир на крайних этажах?».
    Аналогичную модель можно построить с фиктивной переменной Х
    2
    («Крайний этаж»):
    Y = a
    2
    *X
    2
    + с
    (модель №2)
    где:
    X
    2
    - фиктивная переменная «Крайний этаж», принимающая следующие значения:
    X
    2
    = 0 для квартир, расположенных на средних этажах;
    X
    2
    = 1 для квартир, расположенных на крайних этажах.
    Результаты расчетов представлены в Табл. 3 (строка №2). Данная модель идентична модели №1, но константа модели равна среднему значению удельной стоимости квартир на средних этажах, а коэффициент при фиктивной переменной «Крайний этаж» отвечает на вопрос:
    «На сколько в среднем квартиры на крайних этажах дешевле квартир на средних этажах?».

    4
    На этих же данных возможно построить еще один вариант модели, куда будут включены обе обозначенные выше фиктивные переменные.
    При этом будет наблюдаться полная мультиколлинеарность
    2
    (параметры X
    2
    и X
    1
    связаны выражением X
    2
    = 1- X
    1
    ), для устранения которой необходимо исключить из спецификации модели константу:
    Y=a
    1
    *X
    1
    +a
    2
    *X
    2
    Результаты также представлены в Табл. 3 (строка №3). Коэффициенты при фиктивных переменных в данной модели равны средним значениям стоимости квартир на средних и крайних этажах соответственно.
    Табл. 3. Результаты регрессионного анализа
    Модель
    a
    1
    a
    2
    С
    R
    2
    Модель №1 Y=a
    1
    *X
    1
    +c
    3 237
    (546)

    43 499
    (806)
    0,42
    Модель №2 Y=a
    2
    *X
    2
    +c

    -3 237
    (546)
    46 736
    (806)
    0,42
    Модель №3 Y=a
    1
    *X
    1
    +a
    2
    *X
    2
    46 736
    (593)
    43 499
    (546)

    0,998
    Примечания:
    1.
    Следует отметить достаточно низкое значение R
    2
    . Это объясняется тем, что анализируемые квартиры
    отличаются не только этажом расположения, но и состоянием, а также местоположением внутри центрального
    района города. Задачей этого и последующих примеров является демонстрация сути фиктивных переменных;
    2.
    В скобках указаны стандартные ошибки для полученных коэффициентов модели;
    3.
    Для модели без константы (модель №3) вместо коэффициента детерминации R
    2
    определяется
    нецентрированный R
    2
    . Сопоставление нецентрированного R
    2
    с коэффициентом детерминации некорректно.
      1   2   3   4   5   6


    написать администратору сайта