Главная страница
Навигация по странице:

  • 11. ПРОБЛЕМА ГЕТЕРОСКЕДАСТИЧНОСТИ. ОБОБЩЁННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

  • Гефан Г.Д. Эконометрика, 2005. Учебное пособие для студентов специальностей Бухгалтерский учёт, анализ и аудит


    Скачать 0.9 Mb.
    НазваниеУчебное пособие для студентов специальностей Бухгалтерский учёт, анализ и аудит
    Дата04.06.2020
    Размер0.9 Mb.
    Формат файлаpdf
    Имя файлаГефан Г.Д. Эконометрика, 2005.pdf
    ТипУчебное пособие
    #128060
    страница6 из 10
    1   2   3   4   5   6   7   8   9   10
    10. РЕГРЕССИОННЫЙ АНАЛИЗ НЕЛИНЕЙНЫХ
    ЗАВИСИМОСТЕЙ
    10.1. Что такое линейность по переменным и линейность
    по параметрам?
    Линейный регрессионный анализ строится на предположении, что исследуемая зависимость имеет вид, близкий к функции
    b
    X
    a
    X
    a
    X
    a
    Y
    k
    k





    2 2
    1 1
    Величины
    k
    X
    X
    X
    Y
    ,...,
    ,
    ,
    2 1
    являются переменными; их выборочные значе- ния известны. Величины
    b
    a
    a
    a
    k
    ,
    ,...,
    ,
    2 1
    являются параметрами, истинные значения которых неизвестны и должны быть оценены. Записанная функ- ция линейна как по переменным, так и по параметрам.
    Допустим, что истинное соотношение имеет вид
    2 3
    3 2
    2 1
    1
    X
    a
    X
    a
    X
    a
    Y



    Данная функция является нелинейной по переменным, но линейной по па-
    раметрам. Действительно, каждое слагаемое по-прежнему представляет собой произведение параметра на некоторый коэффициент. Если ввести новые переменные
    2 3
    3 2
    2 1
    1
    ,
    ,
    1
    X
    Z
    X
    Z
    X
    Z



    , то соотношение станет линейным и по параметрам, и по переменным:
    3 3
    2 2
    1 1
    Z
    a
    Z
    a
    Z
    a
    Y



    Значит, возможно применение линейного регрессионного анализа.
    Нелинейность по переменным не является препятствием для приме- нения линейного регрессионного анализа.
    Пример 20. В течение 10 сезонов регистрировались данные о коли- честве отдыхавших в санатории (X, человеко-дни) и среднедневном уровне затрат в расчёте на одного отдыхающего (Y, доллары / человеко-дни). Тре- буется оценить регрессию Y по X.
    Год
    1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
    X
    650 550 480 580 690 870 840 750 920 1050
    Y
    12.6 13.5 14.3 13.2 12.3 11.5 11.6 12.0 11.3 11.0

    41
    На рис.4 показаны ис- ходные данные и полу- ченная по ним линия регрессии
    52 16 0057 0



    x
    y
    x
    Коэффициент детер- минации составляет r
    2
    =
    0.931, т.е. качество рег- рессии — неплохое. И всё же, вид графика на- стораживает.
    Скорее всего, точки соответствуют какой-то нелинейной зависимости. В против- ном случае они располагались бы хаотично вокруг прямой линии регрес- сии. Говоря точнее, остатки регрессии чередовались бы случайным обра- зом по знаку и величине. В нашем же случае явно присутствует некая тен- денция: остатки сначала положительны, потом отрицательны, затем снова положительны...
    Это замечание заставляет думать, что функциональное соотношение задано неверно. Каким же оно может быть на самом деле? Для ответа на этот вопрос потребуется обсудить суть рассматриваемого явления. Полные издержки санатория, скорее всего, можно представить в виде
    kX
    I
    I


    0
    , где I
    0
    – часть издержек, не зависящая от числа отдыхающих (содержание помещений, значительная часть расходов на зарплату персонала и комму- нальных платежей и т.п.), а второе слагаемое представляет собой ту часть издержек, которая прямо пропорциональна числу отдыхающих (расходы на питание, лечение и др.). Тогда затраты в расчёте на один человеко-день равны
    k
    X
    I
    Y


    0
    , т.е. истинное соотношение между Y и X не линейно и характеризуется ги- перболической зависимостью. (Конечно, речь идёт не о строгой функцио- нальной зависимости, а о корреляции.) Вводя новую переменную Z = 1 / X, получаем линейную функцию
    Y = I
    0
    Z + k.
    Поскольку выборочные значения Z легко получаются пересчётом значений
    X, можно оценить линейную регрессию Y на Z, после чего снова вернуться к переменной X. В результате этих операций получаем уравнение
    Рис. 4
    10 11 12 13 14 15 400 600 800 1000
    X
    Y

    42 09 8
    9 2958


    X
    Y
    при очень высоком качестве регрессии (r
    2
    = 0.998).
    10.2. Как линеаризовать степенную функцию?
    Пусть истинное соотношение между двумя количественными при- знаками близко к функции
    a
    bX
    Y
    , то есть является нелинейным как по переменной X, так и по параметрам a и b, а случайный член входит в виде множителя:
    i
    a
    i
    i
    bx
    y


    Прологарифмируем (по основанию e) обе части заданного соотношения:
    i
    a
    i
    i
    a
    i
    i
    x
    a
    b
    bx
    y


    ln ln ln
    )
    ln(
    ln




    Если ввести обозначения
    i
    i
    i
    i
    i
    i
    x
    u
    b
    c
    y
    v


    ln
    ,
    ln
    ,
    ln
    ,
    ln




    , то модель становится линейной как по новой переменной, так и по новым парамет- рам:
    i
    i
    i
    c
    au
    v




    Ничто не мешает теперь по выборочным данным найти оценки параметров линейной регрессии
    *
    *
    и
    c
    a
    , и затем от уравнения
    *
    *
    ln ln
    c
    x
    a
    y
    x


    придти к уравнению
    *
    *
    a
    c
    x
    x
    e
    y
    10.3. Как оценить эластичность спроса?
    Как известно, эластичностью y по x называется величина
    x
    y
    dx
    dy
    x
    dx
    y
    dy
    Э
    :
    :


    , которая показывает, во сколько раз относительное изменение функции от- личается от соответствующего относительного изменения аргумента.
    Например, для степенной функции вида
    a
    bx
    y
    эластичность равна
    a
    y
    bax
    x
    y
    bax
    a
    a



    :
    1
    Соотношение между потреблением какого-либо продукта Y и доходом X исследуется в экономике с помощью функций потребления (спроса), кото-

    43 рые могут иметь различный вид. Функции вида
    a
    bX
    Y
    удобны тем, что имеют постоянную, т.е. не зависящую от x эластичность спроса по доходу
    (равную, как мы убедились, коэффициенту a ).
    Пример 21. В таблице для выборки из 10 семей приведены данные о среднедушевых годовых доходах X и потребительских расходах на пита- ние Y (тыс. руб.).
    Требуется:
     оценить линейную регрессию Y по X уравнением
    *
    *
    b
    x
    a
    y
    x


    и найти коэффициент детерминации этой модели;
     оценить параметры степенной модели
    a
    bX
    Y
    , линеаризовав её с помощью логарифмирования, найти коэффициент детерминации и сделать вывод о том, какая из двух регрессий (линейная или степен- ная) имеет более высокое качество;
     определить, на сколько процентов увеличиваются расходы на пита- ние, если доход увеличивается на 1 процент.
    Решение.
    Выполнение 1-го пункта задания (оценка линейной регрессии) не представляет собой ничего нового по сравнению с рассмотренными нами ранее примерами 4, 5, 6, 8. Приводим результаты:
    152 6
    386 0


    x
    y
    x
    ;
    762 0
    2

    r
    Для выполнения следующих пунктов требуется перейти к логариф- мам величин. Для ручного счёта можно использовать таблицу натуральных логарифмов:
    Удобно составить следующую таблицу:
    x
    i
    22 33 27 17 15 35 24 27 40 33
    y
    i
    15 22 18 12 11 18 14 19 20 18
    x
    x
    ln
    x
    x
    ln
    x
    x
    ln
    x
    x
    ln
    10 2.3026 11 2.3979 21 3.0445 31 3.434 41 3.7136 12 2.4849 22 3.0910 32 3.466 42 3.7377 13 2.5649 23 3.1355 33 3.497 43 3.7612 14 2.6391 24 3.1781 34 3.526 44 3.7842 15 2.7081 25 3.2189 35 3.555 45 3.8067 16 2.7726 26 3.2581 36 3.584 46 3.8286 17 2.8332 27 3.2958 37 3.611 47 3.8501 18 2.8904 28 3.3322 38 3.638 48 3.8712 19 2.9444 29 3.3673 39 3.664 49 3.8918 20 2.9957 30 3.4012 40 3.689 50 3.9120

    44 654 0
    6553 0


    u
    v
    u
    ;
    6553 0
    924 1
    x
    y
    x

    ;
    841 0
    2

    r
    Сравнение коэффициентов детерминации степенной и линейной мо- дели показывает, что более высокое качество регрессии обеспечивает сте- пенная модель.
    Эластичность расходов на питание по доходу равна 0.6553. Расходы на питание увеличатся на 0.66% при росте дохода на 1%.
    Полученное значение эластичности показывает, что рост дохода не приводит к прямо пропорциональному росту расходов на питание (в этом случае эластичность была бы равна единице). Действительно, потребности человека в еде ограничены и обычно удовлетворяются полностью при оп- ределённом уровне дохода. Дальнейший рост дохода приводит к росту расходов на иные товары и услуги.
    10.4. Как линеаризовать функцию спроса с двумя
    переменными?
    Функция потребления (спроса) должна иметь вид более сложный, чем соотношения, рассмотренные в примере 21. Кроме величины дохода, существенное влияние на потребительские расходы по отдельным видам товаров оказывает динамика цен. Считается, что реальная функция спроса близка к соотношению
    2 1
    2 1
    a
    a
    X
    bX
    Y
    , где Y – расходы на товар; X
    1
    – доход; X
    2
    индекс цен на товар, отнесённый к индексу стоимости жизни; a
    1
    ,
    a
    2
    — эластичность спроса по доходу и от- носительной цене соответственно. Как произвести оценку параметров a
    1
    ,
    a
    2
    , b с помощью линейного регрессионного анализа?
    Действуя так же, как в пункте 10.2, записываем регрессионную мо- дель в виде
    i
    a
    i
    a
    i
    i
    x
    bx
    y

    2 1
    2 1

    Прологарифмируем обе части заданного соотношения:
    i
    a
    i
    a
    i
    i
    x
    a
    x
    a
    b
    y

    ln ln ln ln ln
    2 1
    2 2
    1 1




    i
    x
    i
    y
    i
    u
    i
    v
    2
    i
    u
    i
    i
    v
    u
    u
    v
    2
    )
    (
    v
    v
    i

    2
    )
    (
    v
    v
    u

    1 22 15 3.0910 2.7081 9.5545 8.3707 2.6799 0.00725 0.01283










    10 33 18 3.4965 2.8904 12.2256 10.1062 2.9456 0.00944 0.02323 суммы







    0.46325 0.38967 сред- ние


    3.2639 2.7932 10.7440 9.1764




    45
    Вводя обозначения
    i
    i
    i
    i
    i
    i
    i
    i
    x
    u
    x
    u
    b
    c
    y
    v


    ln
    ,
    ln
    ,
    ln
    ,
    ln
    ,
    ln
    2 2
    1 1





    , по- лучаем модель, линейную как по новым переменным, так и по новым па- раметрам:
    i
    i
    i
    i
    c
    u
    a
    u
    a
    v





    2 2
    1 1
    Оценив по выборочным данным множественную линейную регрессию, найдём
    *
    *
    2
    *
    1
    ,
    ,
    с
    a
    a
    , а затем вычислим
    *
    *
    c
    e
    b
    Пример 22. Зависимость расходов на питание Y (млрд. долларов) от личного располагаемого дохода X
    1
    (млрд. долларов) и относительного ин- декса цен X
    2
    (индекс цен на питание, делённый на индекс стоимости жизни и умноженный на 100) для США по данным 1959-1983 гг. оценена выбо- рочным уравнением регрессии (Доугерти, 2001):
    48 0
    2 64 0
    1
    ,
    91 16 2
    1


    x
    x
    y
    x
    x
    (в ценах 1972 года, который при исчислении индексов брался за 100%).
    Пусть требуется спрогнозировать расходы населения на питание в буду- щем году, если прогноз личного располагаемого дохода составляет 1100 млрд. долларов, прогноз индекса цен на продукты питания — 230, прогноз индекса стоимости жизни — 215. Вычисляем относительный индекс цен:
    0 107 100
    )
    215
    /
    230
    (
    2



    x
    Прогноз расходов на питание составит долл.
    млрд.
    7 158 107 1100 91 16 48 0
    64 0





    y
    Итак, возможности применения линейного регрессионного анализа не ис- черпываются ситуациями, когда мы предполагаем, что связь между коли- чественными признаками близка к линейной. Соотношение, нелинейное только по переменным, но линейное по параметрам, полностью линеаризу- ется с помощью простой замены переменных (пример 20). Нелинейность по параметрам — более серьёзная проблема. Тем не менее, если Y прибли- жённо представляет собой произведение членов вида X
    a
    , то модель линеа- ризуется с помощью логарифмирования.
    Здесь, правда, необходима оговорка, касающаяся случайного члена.
    Для того чтобы линеаризованная модель регрессии имела вид
    i
    i
    i
    b
    x
    a
    y




    ln ln ln
    , где
    i
    i


    ln

    – ошибка регрессии, необходимо, чтобы в исходном уравне- нии случайный член присутствовал не как слагаемое, а как множитель:

    a
    bX
    Y
    В противном случае линеаризовать модель с помощью логарифмирования не удастся.

    46
    11. ПРОБЛЕМА ГЕТЕРОСКЕДАСТИЧНОСТИ.
    ОБОБЩЁННЫЙ МЕТОД НАИМЕНЬШИХ
    КВАДРАТОВ
    11.1. Как обнаруживается гетероскедастичность?
    Одним из условий применимости обычного МНК (см. п.4.1) является постоянство дисперсии случайного члена
    n
    i
    D
    i
    ,
    1
    const,
    )
    (



    , называемое гомоскедастичностью. Если это свойство не выполняется, то оценки по МНК будут неэффективными. Однако установить это априори невозможно. На практике наличие гетероскедастичности устанавливается с помощью специальных тестов с использованием данных наблюдений. Рас- смотрим тест Голдфелда-Квандта применительно к случаю модели рег- рессии с одной объясняющей переменной.
    Пусть имеется n парных наблюдений
    )
    ,
    (
    i
    i
    y
    x
    1. Все n наблюдений упорядочиваются по величине x , после чего оцениваются отдельные регрессии для первых
    n
    и для последних
    n
    на- блюдений.
    2. Для каждой из регрессий рассчитывается остаточная сумма квад- ратов



    2 2
    )
    (
    x
    i
    e
    y
    y
    S
    3. Отношение
       
    1 2
    2 2
    e
    e
    S
    S
    F
    (индексы 1 и 2 указывают на регрес- сии первых
    n
    и последних
    n
    наблюдений соответственно) сравнивается с критической точкой распределения Фишера
    )
    1
    ,
    1
    ,
    (






    k
    n
    k
    n
    F
    cr

    , где
    1

    k
    – число объясняющих переменных в модели;

    – уровень значимо- сти гипотезы. Если
    cr
    F
    F
    , то отвергается гипотеза о равенстве дисперсий ошибок регрессии и модель признаётся гетероскедастичной.
    Пример 23. Изучается зависимость цены квартиры от её площади.
    Проводится тест Голдфелда-Квандта на гетероскедастичность. Из 300 квартир были оставлены 62 квартиры наименьшей площади (группа 1) и столько же квартир наибольшей площади (группа 2), а затем по каждой группе оценена линейная регрессия
    *
    *
    b
    x
    a
    y
    x


    , где x – площадь (кв. м);
    y
    – цена квартиры (тыс. рублей), и вычислена остаточная сумма квадра- тов. Отношение
       
    1 2
    2 2
    e
    e
    S
    S
    F
    оказалось равным
    34 11
    . Присутствует ли в модели гетероскедастичность?

    47
    Решение
    Значение F необходимо сравнить с критической точкой распределе- ния Фишера
    53 1
    )
    60
    ,
    60
    ,
    05 0
    (

    cr
    F
    , что позволяет сделать вывод о наличии гетероскедастичности. Это проявляется в том, что квартиры большей пло- щади имеют больший разброс в ценах, чем маленькие квартиры.
    11.2. Как устранить гетероскедастичность?
    Иногда хорошим способом устранения гетероскедастичности явля- ется переход к степенной модели
    i
    a
    i
    i
    bx
    y

    1

    с последующей линеаризаци- ей с помощью логарифмирования (см. п.6.2).
    Другой способ может состоять в переходе от обычного МНК к мо- дифицированному (или обобщённому) МНК. Предположим, что в линей- ной модели регрессии дисперсия случайного члена прямо пропорциональ- на квадрату объясняющей переменной, т.е.
    n
    i
    D
    x
    b
    ax
    y
    i
    i
    i
    i
    i
    ,
    1
    ,
    const
    )
    (
    ,







    Поделив каждое уравнение на
    i
    x и введя обозначения
    i
    i
    i
    i
    i
    x
    y
    v
    x
    u


    ,
    1
    , получим новую модель
    i
    i
    i
    a
    bu
    v




    , в которой свободный член гомоскедастичен, а коэффициенты a и
    b
    как бы поменялись ролями. Применяя к этой модели обычный МНК, находим оценки
    *
    a ,
    *
    b , которые одновременно являются эффективными оценками коэффициентов исходной модели обобщённым МНК.
    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта