Главная страница
Навигация по странице:

  • А. А. Кравченко ЭКОНОМЕТРИКА Владивосток 2005 Предисловие

  • Глава 1. Парная регрессия и корреляция 1.1. Теоретические основы

  • 1.2. Решение типовых задач Пример 1. По данным приложения 6 о прожиточном

  • . При увеличении прожиточного

  • 1.3. Задачи для самостоятельного решения Задача 1.

  • !Эконометрика. Эконометрика


    Скачать 0.76 Mb.
    НазваниеЭконометрика
    Дата23.10.2019
    Размер0.76 Mb.
    Формат файлаpdf
    Имя файла!Эконометрика.pdf
    ТипДокументы
    #91521
    страница1 из 6
      1   2   3   4   5   6


    ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
    ТИХООКЕАНСКИЙ ИНСТИТУТ
    ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ И ТЕХНОЛОГИЙ
    А. А. Кравченко
    ЭКОНОМЕТРИКА
    Владивосток
    2005

    Предисловие
    В современных программах подготовки экономистов курс эконометрики занял одно из ключевых мест, поскольку сегодня деятельность в любой области экономики требует от специалиста применения современных методов оценки, анализа и интерпретации экономических данных.
    Сегодня эконометрические методы применяются в качестве стандартных в различных отраслях прикладной экономики, изучающей все, начиная от расходов домашних хозяйств и предпринимательских инвестиций и заканчивая организацией производств, рынков труда и эффектами государственной политики.
    Наиболее важная задача эконометрики состоит в том, чтобы количественно измерить связи между различными экономическими процессами и явлениями на основе имеющихся данных при помощи статистических методов, а также соответствующим образом интерпретировать и использовать полученные результаты. Следовательно, эконометрика – это взаимодействие экономической теории, наблюдаемых данных и статистических методов. Именно взаимодействие этих трех составляющих делает эконометрику интересной, многообещающей и, не самой легкой в понимании.
    Свидетельством всемирного признания эконометрики является присуждение шести нобелевских премий по экономике за разработки в этой области: премия 1969 г. была присуждена Р. Фишеру и Я. Тинбергену за разработку математический методов анализа экономических данных; премия
    1980 г. – Л.Клейну за построение макроэконометрических моделей, основанных на системах эконометрических уравнений; премия 1981 г. – Д.
    Тобину за регрессию с цензурированной зависимой переменной, которую по его имени называют тобит; премия 1989 г. – Т. Хаавелмо за анализ и оценивание систем одновременных уравнений; премия 2000 г. – Дж. Хекману и Д. Макфаддену за разработку теорию и методов, широко использующихся в статистическом анализе поведения индивидуумов и семейных хозяйств; премия 2003 г. – Р. Энглу и К. Грэнжеру за работы в области коинтеграции временных рядов.
    Учебное пособие составлено на основе курса лекций, читаемых автором в Институте менеджмента и бизнеса Дальневосточного государственного университета. Каждая глава учебного пособия состоит из теоретических основ, решения типовых задач и задач для самостоятельного решения.
    Некоторые задачи требуют творческого, исследовательского подхода.
    Учебное пособие предназначено студентам, впервые приступающим к изучению эконометрики.

    Глава 1. Парная регрессия и корреляция
    1.1. Теоретические основы
    Парной регрессией называется уравнение связи двух переменных y и х:
    )
    x
    (
    f y
    =
    , где y – зависимая переменная (результативный признак), x – независимая, объясняющая переменная (факторный признак). По форме связи регрессии делятся на линейные и нелинейные, а по числу входящих переменных – на парные и множественные.
    В случае парной линейной регрессии рассматривается простейшая модель b
    ax y


    +
    =
    , где b
    ,
    a
    - коэффициенты (параметры) регрессии. Для оценки этих коэффициентов пользуются самым популярным в эконометрике методом наименьших квадратов (МНК), суть которого состоит в минимизации суммы квадратов остатков:
    (
    )
    (
    )



    =
    =
    =



    =

    =
    =
    n
    1
    i n
    1
    i
    2
    i i
    2
    i i
    n
    1
    i
    2
    i min b
    ax y
    y
    y e
    S
    , где y
    - фактическое значение результативного признака; y
    - значение результативного признака, полученное путем подстановки в уравнение регрессии факторного признака.
    Искомые коэффициенты являются решением системы нормальных уравнений:
    (
    )
    (
    )



    


    =



    =


    =



    =








    ,
    0
    bx ax x
    y
    2
    b
    S
    ,
    0
    b ax y
    2
    a
    S
    i
    2
    i i
    i i
    i деля каждое уравнение на
    (
    )
    n
    2

    и переходя к средним, получим систему двух линейных уравнений с двумя неизвестными:
    



    =


    =


    0
    x b
    x a
    yx
    ,
    0
    b x
    a y
    2
    Выразим из системы двух уравнений с двумя неизвестными параметры a и b.
    Из первого уравнения x
    a y
    b

    =
    Подставив выражение для b во второе уравнение системы и выразив a, получим следующую формулу:
    2 2
    x x
    x y
    xy a



    =
    Пусть получено следующее уравнение регрессии b
    ax y
    +
    =
    , где x и y – переменные с простыми естественными единицами измерения. Тогда: увеличение x на 1 единицу (в единицах измерения x) приведет к увеличению значения y на a единиц (в единицах измерения y).

    Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии:
    y
    x
    y
    x
    xy
    r
    σ
    σ


    =
    Свойства коэффициента корреляции:
    1. Абсолютная величина коэффициента корреляции не превосходит единицы:
    1

    r
    2. Условие
    1
    ±
    =
    r
    является необходимым и достаточным, чтобы y и x были связаны линейной функциональной зависимостью. Если регрессия является точно линейной и
    0
    =
    r
    , то между y и х нет линейной корреляционной зависимости.
    3. Если коэффициент корреляции положительный, то связь между признаками прямая, т.е. с увеличением (уменьшением) x признак y увеличивается
    (уменьшается).
    Если коэффициент корреляции отрицательный, то связь между признаками обратная, т.е. с увеличением
    (уменьшением) x признак y уменьшается (увеличивается).
    4. Если |r| от 0 до 0,3, то связь между признаками практически отсутствует; если от 0,3 до 0,5, то – слабая; если от 0,5 до 0,7, то – умеренная; если от
    0,7 до 1, то сильная.
    Одним из недостатков линейного регрессионного анализа является то, что он может быть применен только к линейным уравнениям вида b
    ax y
    +
    =
    Например, уравнения вида x
    b a
    y
    +
    =
    и b
    ax y
    =
    является нелинейным. Все нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
    Регрессии, нелинейные по объясняющим переменным:
    9
    полиномы разных степеней
    3 3
    2 2
    1
    x b
    x b
    x b
    a y
    +
    +
    +
    =
    ,
    9
    равносторонняя гипербола x
    b a
    y
    +
    =
    Регрессии, нелинейные по оцениваемым параметрам:
    9
    степенная b
    ax y
    =
    ,
    9
    показательная x
    ab y
    =
    ,
    9
    экспоненциальная bx a
    e y
    +
    =

    Рассмотрим подробнее зависимости x
    b a
    y
    +
    =
    и b
    ax y
    =
    . Графически эти зависимости имеют вид, показанный на рисунке:
    1. x
    b a
    y
    +
    =
    - это обратная зависимость между x и y. Это регрессия на основе гиперболы. Выведем оценки коэффициентов. Составляем функцию суммы квадратов остатков.
    (
    )



    =
    =
    =
    =








    =

    =
    =
    +
    +
    +
    =
    n
    i
    n
    i
    n
    i
    i
    n
    x
    b
    a
    y
    y
    y
    e
    e
    e
    e
    S
    1 1
    1 2
    2 2
    2 2
    2 2
    1


    =

    


    


    +


    +
    +
    =
    n
    i
    x
    b
    a
    x
    b
    y
    ya
    x
    b
    a
    y
    1 2
    2 2
    2
    min
    2 2
    2
    Для определения параметров a и b необходимо решить систему нормальных уравнений:



    


    =


    =


    0
    ,
    0
    b
    S
    a
    S



    


    =
    +

    =


    =
    +

    =







    =
    =
    =
    =
    =
    0 1
    2 2
    1 2
    ,
    0 1
    2 2
    2 1
    1 1
    2 1
    1
    n
    i
    n
    i
    n
    i
    n
    i
    n
    i
    x
    a
    x
    y
    x
    b
    b
    S
    x
    b
    y
    an
    a
    S
    Деля уравнение на 2n, получим:







    =






    +













    =






    +

    0 1
    1
    ,
    0 1
    2
    x
    a
    x
    y
    x
    b
    x
    b
    y
    a
    Решая систему двух уравнений с двумя неизвестными, получим x
    y
    0
    y=a +b /x x
    y
    0
    y= a x b





















    =
    =







    +




















    =
    x
    x
    y
    x
    y
    b
    x
    b
    y
    x
    y
    x
    b
    x
    b
    y
    a
    1 1
    ,
    0 1
    1
    ,
    1 2
    2 2. Рассмотрим теперь функцию b
    ax y
    =
    (это степенные функции).
    Обнаружим, что соотношение b
    ax y
    =
    может быть преобразовано в линейное уравнение путем использования логарифмов. Прологарифмируем обе части этого тождества: x
    ln b
    y ln ax ln y
    ln b
    +
    =
    =
    Заменим
    y
    y

    =
    ln
    ,
    x
    x

    =
    ln
    , a
    a ln

    =
    , тогда x
    b a
    y

    +

    =

    , т.е. получим линейную функцию. В этом случае процедура оценивания параметров состоит в следующем:
    1. Вычислить
    y
    и
    x
    для каждого наблюдения путем взятия логарифмов от исходных данных.
    2. Оценить линейную зависимость x
    b a
    y

    +

    =

    , в результате чего получим оценки a′
    и b. Здесь b является непосредственной оценкой, а a′
    является оценкой a
    ln
    3. Переход к прежним переменным: a
    ln a


    , a
    e a


    - оценка a.
    Тесноту связи между признаками для нелинейных регрессий оценивает индекс корреляции для нелинейной регрессии
    (
    )
    1 0

    ρ

    :
    (
    )
    (
    )





    =
    ρ
    2 2
    y y
    y
    y
    1
    При анализе можно также рассчитывать среднюю ошибку аппроксимации – среднее отклонение расчетных значений от фактических:



    =
    %
    100


    1
    y
    y
    y
    n
    A
    Допустимый предел значений
    A
    – не более 8-10%.
    Проверить значимость уравнения регрессии значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной.
    F-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы
    0
    H
    о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического
    факт
    F
    и критического (табличного)
    табл
    F
    значений F-критерия Фишера.
    факт
    F
    определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

    (
    )
    (
    ) (
    )
    (
    )
    2 1
    1
    /

    /

    2 2
    2 2


    =




    =


    n
    r
    r
    m
    n
    y
    y
    m
    y
    y
    F
    xy
    xy
    факт
    , где n – число единиц совокупности, m – число параметров при переменных x. табл
    F
    - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости
    α
    Уровень значимости
    α
    - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно
    α
    принимается равной 0.05 или 0.01.
    Если факт табл
    F
    F
    <
    , то гипотеза
    0
    H
    - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если же факт табл
    F
    F
    >
    , то гипотеза
    0
    H
    не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
    Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы для каждого показателей. Выдвигается гипотеза
    0
    H
    о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия
    Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
    b
    b
    m
    b
    t
    =
    , а
    а m
    а t
    =
    , r
    r m
    r t
    =
    Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам: n
    S
    m x
    ост a
    σ
    =
    ,
    (
    )
    2
    n y
    y
    S
    2


    =

    , n
    x
    S
    m x
    2
    ост b
    σ

    =

    ,
    2 1
    2


    =
    n
    r
    m
    xy
    r
    xy
    Сравнивая фактическое и критическое (табличное) значения t- статистики -
    табл
    t
    (при n-2 степенях свободы) и
    факт
    t
    - принимаем или отвергаем гипотезу
    0
    H
    Если
    факт
    табл
    t
    t
    <
    , то
    0
    H
    отклоняется, т.е. a, b,
    xy
    r
    не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если
    факт
    табл
    t
    t
    >
    , то гипотеза
    0
    H
    не отклоняется и признается случайная природа формирования a, b,
    xy
    r
    Для расчета доверительного интервала определяем предельную ошибку

    для каждого показателя:
    a
    табл
    a
    m
    t

    =

    ,
    b
    табл
    b
    m
    t

    =


    Формулы для расчета доверительных интервалов имеют следующий вид:
    a
    a
    a

    ±
    =
    γ
    ,
    a
    a
    a
    ьшт


    =
    γ
    ,
    a
    a
    a
    ьфч

    ±
    =
    γ
    ,
    b
    b
    b

    ±
    =
    γ
    ,
    b
    b
    b
    ьшт


    =
    γ
    ,
    b
    b
    b
    ьфч

    ±
    =
    γ
    Прогнозное значение
    p
    y
    определяется путем подстановки в уравнение регрессии b
    ax y
    +
    =
    соответствующего (прогнозного) значения
    p
    x
    Экстраполяция кривой регрессии, т.е. ее использование вне пределов обследованного диапазона значений объясняющей переменной может привести к значительным погрешностям, поэтому при определении прогнозного значения строят и доверительные интервалы прогноза.
    Вычисляется средняя ошибка прогноза
    m
    :
    (
    )
    (
    )



    +
    +
    =
    2 2
    p x
    x x
    x n
    1 1
    s m
    , где
    (
    )
    1

    2



    =

    m
    n
    y
    y
    s
    ; и строится доверительный интервал прогноза
    p
    y
    p
    y



    ±
    =
    γ
    , где
    m
    t
    табл
    н
    з

    =


    Величина стандартной ошибки достигает минимума при x
    x р
    =
    и возрастает по мере удаления от среднего значения в обе стороны. Результаты прогноза ухудшаются в зависимости от того, насколько прогнозное значение отклоняется от области наблюдений значений фактора x.
    На графике доверительные границы для прогноза представляют собой гиперболы, расположенные по обе стороны от линии регрессии.
    Экстраполяция кривой регрессии, т.е. ее использование вне пределов обследованного диапазона значений объясняющей переменной может привести к значительным погрешностям, поэтому при определении прогнозного значения строят и доверительные интервалы прогноза:
    (
    )
    (
    )
    (
    )
    (
    )










    +
    +

    +










    +
    +








    2 2
    *
    2 2
    ,
    1
    *
    2 2
    *
    2 2
    ,
    1
    *
    1 1
    ;
    1 1
    x
    x
    x
    x
    n
    s
    t
    y
    x
    x
    x
    x
    n
    s
    t
    y
    т
    т
    α
    α
    , где
    (
    )
    2

    2 2


    =

    n
    y
    y
    s
    В силу воздействия неучтенных случайных факторов и причин отдельные наблюдения y будут в большей или меньшей степени отклоняться от функции регрессии f(x). В этом случае в общем виде уравнение взаимосвязи двух переменных может быть представлено в виде:
    u
    x
    f
    y
    +
    =
    )
    (
    , где u – случайная переменная, характеризующая отклонение от функции регрессии. В случае парной линейной зависимости модель имеет вид:
    u
    b
    ax
    y
    +
    +
    =
    Гомоскедастичность – условие «одинакового разброса», т.е. вероятность того, что величина u примет какое-то положительное (отрицательное)
    данное значение, будет одинаковой для всех наблюдений, т.е.
    const
    u
    i
    =
    )
    (
    2
    σ
    ,
    i

    . Гетероскедастичность – условие «неодинакового разброса»,
    2 2
    )
    (
    i
    i
    u
    σ
    σ
    =
    - дисперсия не обязательно одинакова для всех наблюдений i.
    Если СКО остатков растет по мере увеличения x. Поле корреляции такой гетероскедастичной модели представлено ниже:
    Вариация y при больших значениях х гораздо больше, чем при малых значениях х. Зависимость y от x может вполне пригодиться для практических приложений, но результаты, связанные с анализом точности модели, оценкой значимости и построением доверительных интервалов, могут оказаться непригодными. Например, при небольших выборках есть риск получить оценку параметров, существенно отличающуюся от истинного параметра.
    Очень часто проявление проблемы гетероскедастичности можно предвидеть заранее, основываясь на знании характера статистических данных. В таких случаях можно предпринять соответствующие действия по устранению этого эффекта еще на этапе спецификации модели, т.е. на этапе формулировки вида модели.
    Рассмотрим два теста, в которых делаются различные предположения о зависимости между средним квадратическим отклонением случайного члена и величиной объясняющей переменной.
    1. Тест ранговой корреляции Спирмена. При выполнении теста
    Спирмена предполагается, что среднее квадратическое отклонение случайной переменной либо увеличивается, либо уменьшается по мере увеличения x.
    Этапы проведения теста:
    1. Ранжируются значения x. Ранг – порядковый номер значения x.
    Ранжирование – упорядочивание. Если значения совпадают, то им присваивается ранг, равный среднему арифметическому из суммы мест, которые они занимают.
    2. Вычисляются отклонения фактических значений от расчетных
    (остатки). Ранжируются остатки. x
    y
    0

    3. Вычисляется коэффициент ранговой корреляции по формуле
    )
    1
    (
    6 1
    2 2
    ,


    =

    n
    n
    D
    r
    i
    e
    x
    , где
    i
    D
    - разность между рангом x и рангом остатков.
    4. Вычисляется t-статистика
    1
    ,

    n
    r
    e
    x
    . Определяется по таблицам критерия Стьюдента при уровне значимости
    α
    табличное значение при бесконечном числе степеней свободы.
    5. По этому критерию гипотеза об отсутствии гетероскедастичности будет отклонена при уровне значимости
    α
    , если тестовая статистика
    1
    ,

    n
    r
    e
    x
    превышает табличное значение.
    2. Тест Голдфелда-Квандта. При проведении проверки по этому критерию, предполагается, что стандартное отклонение
    i
    σ
    распределения вероятностей случайного члена
    i
    u
    пропорционально значению
    i
    x
    в этом наблюдении. Предполагается, что случайный член распределен нормально и не подвержен автокорреляции.
    Все n наблюдений упорядочиваются по x. Оцениваются отдельные регрессии для первых
    n
    и последних
    n
    наблюдений, а средние
    n
    n

    − 2
    наблюдений отбрасываются. Если предположение о природе гетероскедастичности верно, то дисперсия случайного члена в последних
    n
    наблюдениях будут больше, чем в первых
    n
    . Обозначая сумму квадратов остатков через
    1
    RSS
    и
    2
    RSS
    , рассмотрим их отношение
    2 1
    RSS
    RSS
    . Эта величина имеет F-распределение с
    1


    k
    n
    и
    1


    k
    n
    степенями свободы, где
    k
    – число объясняющих переменных в регрессионном уравнении.
    Для оценки коэффициентов регрессии с гетероскедастичностью применяется взвешенный метод наименьших квадратов, этапы которого следующие:
    1. Оценивают обычным методом наименьших квадратов регрессию y на x. Вычисляют столбец квадратов остатков.
    2. Оценивают коэффициенты регрессии квадратов остатков на
    2
    x
    :
    2 1
    0 2
    x
    a
    a
    e
    +
    =
    . Вычисляют набор значений, каждое из которых равно корню из соответствующего расчетного значения
    2
    e
    . Этот вектор называется набор весов, на эти значения делятся исходные значения
    y
    и
    x
    3. Вычисляют
    2
    e
    x
    X
    =
    ,
    2
    e
    y
    Y
    =
    . Оценивают регрессию Y на X.
    Оценивают регрессию методом наименьших квадратов.
    1.2. Решение типовых задач
    Пример 1. По данным приложения 6 о прожиточном
    минимуме (x), среднемесячной заработной плате (y) построить

    уравнение зависимости
    b ax y
    +
    =
    . Вычислить коэффициент
    корреляции, проинтерпретировать результаты.
    Напишем
    уравнение
    регрессии
    и
    рассчитаем
    его
    параметры:
    x
    13 3
    2201
    y
    +

    =
    . При увеличении прожиточного
    минимума на 1 рубль среднемесячная заработная плата
    увеличится на 3,13 рубля.
    Тесноту линейной связи оценит коэффициент корреляции:
    87 0
    y x
    xy r
    y x

    σ
    σ


    =
    .
    Коэффициент корреляции свидетельствуют о тесной связи между среднемесячной заработной платой и прожиточным минимумом и 76% изменения заработной платы объясняется изменением прожиточного минимума.
    Пример 2.
    Изучается зависимость заработной платой – y (ден.ед.) и стажем работника x (лет). Проверим гипотезу о том, что с увеличением стажа увеличивается вариация заработной платы, т.е. что имеет место гетероскедастичность.
    Воспользуемся тестом ранговой корреляции Спирмена. Составим расчетную таблицу.
    Составим уравнение парной регрессии:
    ;
    b
    ax
    y
    +
    =
    где
    a
    и
    b
    вычисляются по формулам
    ( )
    2 2
    x
    x
    y
    x
    y
    x
    a



    =
    ;
    x
    a
    y
    b

    =
    . Получим:
    996
    ,
    27 06
    ,
    22 6
    ,
    617 06
    ,
    22 4
    ,
    2578 3196 44
    ,
    77 5
    ,
    99 293 8
    ,
    8 3196
    =
    =

    =



    =
    a
    ;
    63
    ,
    46 37
    ,
    246 293 8
    ,
    8 996
    ,
    27 293
    =

    =


    =
    b
    Таким образом, регрессионное уравнение примет вид:
    63
    ,
    46 996
    ,
    27

    =
    x
    y
    Уравнение показывает, что при увеличении стажа на 1 год заработная плата возрастает на 27,996 ден.ед.

    x
    y
    xy
    2
    x
    y
    y
    y

    1 1
    80 80 1
    74,626 5,374 2
    2 70 140 4
    102,622
    -32,622 3
    2 120 240 4
    102,622 17,378 4
    3 140 420 9
    130,618 9,382 5
    4 130 520 16 158,614
    -28,614 6
    5 160 800 25 186,61
    -26,61 7
    6 180 1080 36 214,606
    -34,606 8
    7 250 1750 49 242,602 7,398 9
    8 200 1600 64 270,598
    -70,598 10 9
    350 3150 81 298,594 51,406 11 10 450 4500 100 326,56 123,44 12 11 250 2750 121 354,586
    -104,586 13 11 540 5940 121 354,586 185,414 14 12 350 4200 144 382,582
    -32,582

    Проранжируем значения
    x
    и
    e

    x
    rangx
    e
    e
    rang
    (
    )
    2
    e
    rang
    rangx

    1 1
    1 5,374 2
    1 2
    2 2,5
    -32,622 9
    42,25 3
    2 2,5 17,378 5
    6,25 4
    3 4
    9,382 4
    0 5
    4 5
    -28,614 7
    4 6
    5 6
    -26,61 6
    0 7
    6 7
    -34,606 10 9
    8 7
    8 7,398 3
    25 9
    8 9
    -70,598 12 9
    10 9
    10 51,406 11 1
    11 10 11 123,44 17 36 12 11 12,5
    -106,586 14 2,25 13 11 12,5 185,414 19 42,25 14 12 14,5
    -32,582 8
    42,25 15 12 14,5 117,418 16 2,25 16 13 16
    -140,578 18 4
    17 14 17 111,426 15 4
    18 15 18,5
    -226,57 20 2,25 19 15 18,5 73,43 13 30,25 20 16 20
    -4,566 1
    361

    -
    -
    -
    -
    624
    (
    )
    624
    e rang rangx
    D
    2
    =

    =

    Вычислим коэффициент ранговой корреляции Спирмена:
    (
    )
    531
    ,
    0 7980 3744 1
    399 20 624 6
    1 1
    6 1
    2
    =

    =



    =



    =
    n
    n
    D
    r
    ,
    315
    ,
    2 359
    ,
    4 531
    ,
    0 19 531
    ,
    0 1
    =

    =
    =

    n
    r
    ,
    96
    ,
    1 05
    ,
    0
    =
    t
    Т.к. 2,315>1,96, то имеет место гетероскедастичность.
    Избавимся от гетероскедастичности.
    Для этого вычислим коэффициенты регрессии, где в качестве результативного
    y
    возьмем столбец квадратов остатков
    2
    e
    :
    2 1
    0 2
    x
    a
    a
    e
    +
    =
    , где
    0
    a
    и
    1
    a
    вычисляются по формулам:
    ( )
    2 2
    4 2
    2 1
    x
    x
    x
    y
    x
    y
    a



    =
    ;
    2 1
    0
    x
    a
    y
    a

    =
    ,
    15 12 500 6000 144 382,582 117,418 16 13 270 3510 169 410,578
    -140,578 17 14 550 7700 196 438,574 111,426 18 15 240 3600 225 466,57
    -226,57 19 15 540 8100 225 466,57 73,43 20 16 490 7840 256 494,566
    -4,566

    176 5860 63920 1990 5859,866 0
    Среднее значение
    8,8 293 3196 99,5 292,99 0

    535
    ,
    1 05
    ,
    6593 5
    ,
    10117 05
    ,
    6593 5
    ,
    29153 39271 25
    ,
    9900 3
    ,
    16493 5
    ,
    99 293 39271 1
    =
    =

    =



    =
    a
    ,
    267
    ,
    140 733
    ,
    152 293 5
    ,
    99 535
    ,
    1 293 0
    =

    =


    =
    a
    ,
    2 2
    535
    ,
    1 267
    ,
    140
    x
    e
    +
    =

    y
    2
    x
    2
    yx
    4
    x
    1 80 1
    80 1
    2 70 4
    280 16 3
    120 4
    480 16 4
    140 9
    1260 81 5
    130 16 2080 256 6
    160 25 4000 625 7
    180 36 6480 1296 8
    250 49 12250 2401 9
    200 64 12800 4096 10 350 81 28350 6561 11 450 100 45000 10000 12 250 121 30250 14641 13 540 121 65340 14641 14 350 144 50400 20736 15 500 144 72000 20736 16 270 169 45630 28561 17 550 196 107800 38416 18 240 225 54000 50625 19 540 225 121500 50625 20 490 256 125440 65536

    5860 1990 785420 329866
    Среднее значение
    293 99,5 39271 16493,3
    Вычислим набор значений-весов, каждое из которых равно квадратному корню из соответствующего расчетного значения:
    2
    e
    . Этот вектор называется набором весов и на эти значения делятся исходные значения
    y
    и
    x
    :
    2
    e
    x
    X
    =
    ,
    2
    e
    y
    Y
    =
    № 2
    e
    2
    e
    2
    e
    X
    Y
    1 28,880 141,802 11,908 0,084 6,718 2
    1064,195 146,407 12,100 0,165 5,785 3
    301,995 146,407 12,100 0,165 9,917 4
    88,022 154,082 12,413 0,242 11,279 5
    818,761 164,827 12,838 0,312 10,126 6
    708,092 178,642 13,366 0,374 11,971 7
    1197,575 195,527 13,983 0,429 12,873 8
    54,730 215,482 14,679 0,477 17,031 9
    4984,078 238,507 15,444 0,518 12,950 10 2642,577 264,602 16,267 0,553 21,516 11 15237,434 293,767 17,140 0,583 26,255

    К новым переменным
    X
    и
    Y
    применяется метод наименьших квадратов.
    Для этого оценивается регрессия:
    b
    aX
    Y
    +
    =
    Вычислим коэффициенты:
    189
    ,
    26 037
    ,
    0 969
    ,
    0 037
    ,
    0 081
    ,
    8 05
    ,
    9 238
    ,
    0 275
    ,
    0 56
    ,
    16 488
    ,
    0 05
    ,
    9
    =
    =

    =



    =
    a
    ,
    78
    ,
    3 78
    ,
    12 56
    ,
    16 488
    ,
    0 189
    ,
    26 56
    ,
    16
    =

    =


    =
    b
    Регрессия
    b
    aX
    Y
    +
    =
    имеет вид:
    78
    ,
    3 189
    ,
    26
    +
    =
    X
    Y
    . Уравнение показывает, что при увеличении стажа на 1 год заработная плата возрастает на 26,189 ден.ед.

    X
    Y
    XY
    2
    X
    1 0,084 6,718 0,564 0,007 2
    0,165 5,785 0,955 0,027 3
    0,165 9,917 1,636 0,027 4 0,242 11,279 2,730 0,059 5 0,312 10,126 3,159 0,097 6 0,374 11,971 4,477 0,140 7 0,429 12,873 5,523 0,184 8 0,477 17,031 8,124 0,228 9
    0,518 12,95 6,708 0,268 10 0,553 21,516 11,898 0,306 11 0,583 26,255 15,307 0,340 12 0,609 13,846 8,432 0,371 13 0,609 29,908 18,214 0,371 14 0,631 18,413 11,619 0,398 15 0,631 26,305 16,598 0,398 16 0,65 13,505 8,778 0,423 17 0,667 26,187 17,467 0,445 18 0,681 10,891 7,417 0,464 12 10938,231 326,002 18,056 0,609 13,846 13 34378,351 326,002 18,056 0,609 29,908 14 1061,587 361,307 19,008 0,631 18,413 15 13786,987 361,307 19,008 0,631 26,305 16 19762,174 399,682 19,992 0,650 13,505 17 12415,753 441,127 21,003 0,667 26,187 18 51333,965 485,642 22,037 0,681 10,891 19 5391,965 485,642 22,037 0,681 24,504 20 20,848 533,227 23,092 0,693 21,220

    176216,2 5859,99 334,526 9,755 331,199
    Среднее значение
    8810,81 293 16,726 0,488 16,560

    19 0,681 24,504 16,687 0,464 20 0,693 21,22 14,705 0,480

    9,755 331,199 180,998 5,496 0,488 16,56 9,05 0,275
    1.3. Задачи для самостоятельного решения
    Задача 1.
    Для трех видов продукции A, B и С модели зависимости удельных постоянных расходов от объема выпускаемой продукции выглядят следующим образом: y
    A
    = 600, y
    B
    = 80+0.7x, y
    С
    = 40x
    0.5
    . Определите коэффициенты эластичности по каждому виду продукции и поясните их смысл. Сравните при x=1000 эластичность затрат для продукции B и С.
    Определите, каким должен быть объем выпускаемой продукции, чтобы коэффициенты эластичности для продукции B и С были равны.
    Задача 2.
    Пусть имеется следующая модель регрессии, характеризующая зависимость y от x: y=8-7x. Известно также, что r xy
    =-0.5; n=20. Постройте доверительный интервал для коэффициента регрессии в этой модели: а) с вероятностью 90%, б) с вероятностью 99%.
    Задача 3.
    Зависимость среднемесячной производительности труда от возраста рабочих характеризуется моделью: y=a+bx+cx
    2
    . Оцените качество модели, определив ошибку аппроксимации, индекс корреляции и F-критерий
    Фишера, если ее использование привело к результатам, представленным в таблице.
    Производительность труда рабочих, тыс. руб., y
    № п.п.
    Фактическая
    Расчетная
    1 12 10 2 8 10 3 13 13 4 15 14 5 16 15 6 11 12 7 12 13 8 9 10 9 11 10 10 9 9
    Задача 4.
    Для двух видов продукции А и Б зависимость расходов предприятия y (тыс. руб.) от объема производства x (шт.) характеризуется данными, представленными в табл.
    Уравнение регрессии
    Показатели корреляции
    Число наблюдений y
    А
    =160+0.8x 0.85 30 y
    Б
    =50x
    0.6 0.72 25

    Поясните смысл величин 0,8 и 0,6 в уравнениях регрессии. Сравните эластичность расходов от объема производства для продукции А и Б при выпуске продукции А в 500 единиц. Определите, каким должен быть выпуск продукции А, чтобы эластичность ее расходов совпадала с эластичностью расходов на продукцию Б. Оцените значимость каждого уравнения регрессии с помощью F-критерия Фишера.
    Задача 5.
    По территориям Центрального района известны данные за сентябрь 2002 г. (приложение 6). Постройте поле корреляции и сформулируйте гипотезу о форме связи. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической, парной регрессии. Оцените тесноту связи с помощью показателей корреляции и детерминации Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
    Оцените с помощью средней ошибки аппроксимации качество уравнений. С помощью F-критерия Фишера оцените статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных для разных моделей, выберите лучшее уравнение регрессии и дайте его обоснование. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня.
    Определите доверительный интервал прогноза для уровня значимости
    α=0,05. Оцените полученные результаты, выводы оформите в аналитической записке.
    Задача 6. Рассматривается зависимость между сменной добычей угля на одного рабочего (y, тонн) и мощностью пласта (x, м) по следующим 10 шахтам:

    № x
    y
    1 8
    5
    2 11
    10
    3 12
    10
    4 9 7
    5 8 5
    6 8 6
    7 9 6
    8 9 5
    9 8 6
    10 12 8
    Постройте поле корреляции и сформулируйте гипотезу о форме связи.
    Рассчитайте параметры линейного уравнения и выбранного нелинейного.
    Оцените тесноту связи с помощью показателей корреляции и детерминации
    Сделайте прогноз сменной добычи угля на одного рабочего при мощности пласта, равной 102% от среднего уровня. Рассчитайте доверительный интервал прогноза. Изобразите прогноз и доверительный интервал на поле корреляции.
    Задача 7.
    Администрация страховой компании приняла решение о введении нового вида услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции:
    № п/п
    1 2
    3 4
    5 6
    7 8
    9 10
    Общая сумма ущерба, млн.руб.
    26,2 17,8 31,3 23,1 27,5 36,0 14,1 22,3 19,6 31,3
    Расстояние до ближайшей станции, км
    3,4 1,8 4,6 2,3 3,1 5,5 0,7 3,0 2,6 4,3
    Напишите уравнение этой зависимости, оцените ее значимость на 5% уровне.
    Сделайте вывод.

      1   2   3   4   5   6


    написать администратору сайта