Главная страница
Навигация по странице:

  • (5 букв)

  • 1. Выбор факторов для регрессионного анализа: 1) Корреляционный анализ данных, включая проверку теста Фаррара –Глоубера на мультиколлинеарность факторов.

  • 2) Пошаговый отбор факторов методом исключения из модели статистически незначимых переменных


  • Основные этапы теста Голдфельда-Квандта

  • 12 эконометрика (вариант 8). Содержание Задание 1 Сравнительный анализ метода наименьших квадратов и метода макмального правдоподобия при определении параметров эконометрических моделей. Ответ


    Скачать 168.04 Kb.
    НазваниеСодержание Задание 1 Сравнительный анализ метода наименьших квадратов и метода макмального правдоподобия при определении параметров эконометрических моделей. Ответ
    Дата09.01.2023
    Размер168.04 Kb.
    Формат файлаdocx
    Имя файла12 эконометрика (вариант 8).docx
    ТипДокументы
    #878313

    Титульник
    Содержание

    Задание 1


    Сравнительный анализ метода наименьших квадратов и метода макϲᴎмального правдоподобия при определении параметров эконометрических моделей.

    Ответ

    Задание 2


    Данные каждого варианта определяется параметрами p1, p2. При выполнении контрольных заданий студент должен подставить там, где это необходимо, вместо буквенных параметров индивидуальные анкетные характеристики: p1 – число букв в полном имени студента (5 букв); p2– число букв в фамилии студента (9 букв).

    Исследуется зависимость производительности труда (т/ч) от уровня механизации работ (%), среднего возраста работников (лет) и энерговооруженности (кВт/100 работающих) по данным 14 промышленных предприятий.

    Таблица 1

    № завода

    Уровень механизации работ,

    Средний возраст работников,

    Энерговооруженность,

    Производительность труда,

    1

    32+p1

    33+p2

    300+p2

    20+p1

    2

    30+p1

    31+p2

    290+p1

    24+p2

    3

    36+p1

    41+p2

    350+p2

    28+p1

    4

    40+p1

    39+p2

    400+p1

    30+p2

    5

    41+p1

    46+p2

    400+p2

    31+p1

    6

    47+p1

    43+p2

    480+p1

    33+p2

    7

    56+p1

    34+p2

    500+p2

    34+p1

    8

    54+p1

    38+p2

    520+p1

    37+p2

    9

    60+p1

    42+p2

    590+p2

    38+p1

    10

    55+p1

    35+p2

    540+p1

    40+p2

    11

    61+p1

    39+p2

    600+p2

    4+p1

    12

    67+p1

    44+p2

    700+p1

    43+p2

    13

    69+p1

    40+p2

    700+p2

    45+p1

    14

    76+p1

    41+p2

    750+p1

    48+p2

    15

    30+p1

    32+p2

    350+p2

    25+p1

    16

    32+p1

    31+p2

    295+p1

    24+p2

    17

    36+p1

    45+p2

    355+p2

    30+p1

    18

    45+p1

    35+p2

    400+p1

    32+p2

    19

    40+p1

    48+p2

    400+p2

    35+p1

    20

    45+p1

    40+p2

    485+p1

    33+p2

    21

    50+p1

    35+p2

    510+p2

    32+p1

    22

    55+p1

    48+p2

    530+p1

    35+p2

    23

    62+p1

    52+p2

    595+p2

    40+p1

    24

    60+p1

    35+p2

    540+p1

    42+p2

    25

    65+p1

    39+p2

    600+p2

    47+p1


    В соответствии с вариантом задания, используя статистический материал, необходимо выполнить:

    1. Выбор факторов для регрессионного анализа:

    1) корреляционный анализ данных, включая проверку теста Фаррара –Глоубера на мультиколлинеарность факторов;

    2) пошаговый отбор факторов методом исключения из модели статистически незначимых переменных;

    3) проверка теста на «длинную» и «короткую» регрессии (при несоответствии результатов, полученных в пунктах 1 и 2).

    2. Построение модели множественной регрессии с выбранными факторами, экономический анализ коэффициентов уравнения.

    3. Оценку качества модели регрессии:

    1) проверка статистической значимости уравнения с помощью F-критерия Фишера;

    2) проверка предпосылки МНК о гомоскедастичности остатков;

    3) оценка уровня точности модели.

    4. Построение доверительных интервалов для результирующей переменной и определение компаний с заниженным и завышенным фактическим уровнем энерговооруженности (производительности «у»). Ранжирование компаний по степени их эффективности на основе результатов моделирования.

    5. Оценку степени влияния факторов на результат с помощью коэффициентов эластичности, и коэффициентов. Выбор наиболее влияющего фактора.

    6. Построение парной регрессии с наиболее влияющим фактором. Сравнение качества множественной и парной регрессий.

    7. Прогнозирование энерговооруженности (производительности ) на основе модели парной регрессии с вероятностью 95% при условии, что прогнозное значение фактора увеличится на 10% относительно его среднего значения.

    8. Графическое представление результатов моделирования.

    Решение

    В соответствии с исходными данными варианта составляем таблицу со значениями, которые необходимо обработать (таблица 2).

    Таблица 2

    Исходные данные

    № завода

    Уровень механизации работ,

    Средний возраст работников,

    Энерговооруженность,

    Производительность труда,

    1

    37

    42

    309

    25

    2

    35

    40

    290

    33

    3

    41

    50

    359

    33

    4

    45

    48

    405

    39

    5

    46

    55

    409

    36

    6

    52

    52

    485

    42

    7

    61

    43

    509

    39

    8

    59

    47

    525

    46

    9

    65

    51

    599

    43

    10

    60

    44

    545

    49

    11

    66

    48

    609

    9

    12

    72

    53

    705

    52

    13

    74

    49

    709

    50

    14

    81

    50

    755

    57

    15

    35

    41

    359

    30

    16

    37

    40

    300

    33

    17

    41

    54

    364

    35

    18

    50

    44

    405

    41

    19

    45

    57

    409

    40

    20

    50

    49

    490

    42

    21

    55

    44

    519

    37

    22

    60

    57

    535

    44

    23

    67

    61

    604

    45

    24

    65

    44

    545

    51

    25

    70

    48

    609

    52


    1. Выбор факторов для регрессионного анализа:

    1) Корреляционный анализ данных, включая проверку теста Фаррара –Глоубера на мультиколлинеарность факторов.

    На рис. 1 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в MS Excel.

    Матрица коэффициентов парной корреляции



    Рис. 1 – Матрица коэффициентов парной корреляции

    Визуальный анализ матрицы на рис. 1 позволяет установить:

    1) переменная имеет довольно высокие парные корреляции с переменными и . Переменную далее не будем рассматривать.

    2) большинство переменных анализа демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных.

    Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам и .

    Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов, реализация которых представлена ниже.

    Проверка наличия мультиколлинеарности всего массива переменных.

    Построим матрицу межфакторных корреляций (рис. 2) и найдем её определитель с помощью функции МОПРЕД().



    Рис. 2 – Матрица межфакторных корреляций R и значение определителя

    Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов. Подтвердим это предположение оценкой статистики Фаррара-Глоубера.

    Вычислим наблюдаемое значение статистики Фаррара – Глоубера по формуле:



    где – количество наблюдений (заводов); – количество факторов (переменных анализа), подставляем значения в формулу (1):



    Фактическое значение этого критерия сравниваем с табличным значением критерия с степенью свободы и уровне значимости . Табличное значение можно найти с помощью функции ХИ2.ОБР.ПХ(0,05; 1).

    Так как (71,667 > 3,841), то в массиве объясняющих переменных существует мультиколлинеарность.

    Проверка наличия мультиколлинеарности каждой переменной с другими переменными.

    Вычислим обратную матрицу с помощью функции MS Excel МОБР (рис. 3).



    Рис. 3 – Обратная матрица

    Вычисление F-критериев



    где – диагональные элементы матрицы (рис. 4).



    Рис. 4 – Значения F-критериев

    Фактические значения F-критериев сравниваются с табличным значением при и степенях свободы и уровне значимости , где – количество факторов.

    Так как все значения F-критериев больше табличного, то все исследуемые независимые переменные мультиколлинеарны с другими.

    Уточнение набора факторов, наиболее подходящих для регрессионного анализа, осуществим другими методами отбора.

    2) Пошаговый отбор факторов методом исключения из модели статистически незначимых переменных

    В соответствии с общим подходом, пошаговый отбор следует начинать с включения в модель всех имеющихся факторов, то есть в нашем случае с трёхфакторной регрессии. Но мы не будем включать в модель факторы из заранее известных коллинеарных пар, а также фактор , имеющий слабую связь с . Таким образом, пошаговый отбор факторов начнем с двухфакторного уравнения. Фрагмент двухфакторного регрессионного анализа представлен на рис. 5.



    Рис. 5 – Фрагмент двухфакторного регрессионного анализа

    Статистически незначимыми оказались три фактора (на рис. 1 они выделены жирным шрифтом). На следующем этапе пошагового отбора удаляем статистически незначимый фактор с наименьшим значением t-критерия, то есть фактор ОА (на рисунке 2 выделен цветом).

    Аналогично поступаем до тех пор, пока не получим уравнение, в котором все факторы окажутся статистически значимыми. Этапы получения такого уравнения, то есть фрагменты соответствующих регрессионных анализов, представлены на рисунках 3, 4.





    t табл(0.05;109-4-1=104)=

    1.983037471




    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    -3255.832024

    15398.16512

    -0.211442857

    ОС

    -0.040859333

    0.016074384

    -2.541891019

    ПП

    0.650673211

    0.062463899

    10.41678825

    ДО

    0.032173752

    0.019338145

    1.663745481

    КО

    0.048029464

    0.027130844

    1.770290058

    Рисунок 3. Фрагмент четырехфакторного регрессионного анализа









    tтабл(0,05;109-3-1=105)=

    1.982815217




    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    -4456.711199

    15510.19708

    -0.28734072

    ОС

    -0.037629315

    0.016090498

    -2.338604743

    ПП

    0.647303561

    0.062954486

    10.28208794

    КО

    0.071691944

    0.023297943

    3.07717916


    Рисунок 4. Фрагмент трехфакторного регрессионного анализа

    Из рисунка 3 видно, что уравнение с тремя факторами ОС, ПП и КО обладает статистически значимыми коэффициентами перед факторами (в нем незначим только свободный член), а, значит, и сами эти факторы статистически значимы.

    Таким образом, в результате пошагового отбора получено трехфакторное уравнение регрессии, все коэффициенты которого (кроме свободного члена) значимы при 5%-ном уровне значимости, вида

    ,

    где Y – ЧП, – ОС, – ПП, – КО.

    3) Проверка теста на «длинную» и «короткую» регрессии

    По результатам пунктов 1) и 2) возникает необходимость выбора из двух регрессий: «длинной» – с тремя факторами (ОС, ПП и КО) и «короткой» – с одним фактором (ПП).

    Воспользуемся тестом на «длинную» и «короткую» регрессии. Этот тест используется для отбора наиболее существенных объясняющих переменных. Иногда переход от большего числа исходных показателей анализируемой системы к меньшему числу наиболее информативных факторов может быть объяснен дублированием информации, из-за сильно взаимосвязанных факторов. Стремление к построению более простой модели приводит к идее уменьшения размерности модели без потери её качества. Для этого используют тест проверки «длинной» и «короткой» регрессий.

    Рассмотрим две модели регрессии:

    yi= β0 + β1 xi1 +…+ βk xik+ε i (длинную)

    yi= β0 + β1 xi1 +…+ βk xik-q+εi (короткую)

    Предположим, что модель не зависит от последних q объясняющих переменных и их можно исключить из модели. Это соответствует гипотезе

    H0: βk-q+1 = βk-q+2…= βk =0,

    т.е. последние q коэффициентов равны нулю.

    Алгоритм проверки следующий:

    o Построить по МНК длинную регрессию по всем факторам и найти для неё сумму квадратов остатков – .

    o Построить по МНК короткую регрессию по первым факторам и найти для неё сумму квадратов остатков – .

    o Вычислить F-статистику



    o Если Fнабл>Fтабл (α, v1=q, v2=n-k-1), гипотеза отвергается (выбираем длинную регрессию), в противном случае – выбираем короткую регрессию.

    На основании данных нашего примера сравним две модели: «длинную» (с факторами , , ) и «короткую» (только с фактором ).

    1) Построим длинную регрессию по трем факторам , , и найдем для неё сумму квадратов остатков – (рисунок 5).

    Дисперсионный анализ











    df

    SS

    MS

    Регрессия




    1.04794E+13

    3.49313E+12

    Остаток




    2.25564E+12




    Итого




    1.2735E+13














    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    -4456.711199

    15510.19708

    -0.28734072

    ОС

    -0.037629315

    0.016090498

    -2.338604743

    ПП

    0.647303561

    0.062954486

    10.28208794

    КО

    0.071691944

    0.023297943

    3.07717916

    Рисунок 5. Фрагмент регрессионного анализа для длинной (трехфакторной) регрессии

    2) Построим короткую регрессию по одному фактору и найдем для неё сумму квадратов остатков – (рисунок 6).



    Дисперсионный анализ











    df

    SS

    MS

    Регрессия




    1.02234E+13

    1.02234E+13

    Остаток




    2.51168E+12




    Итого




    1.2735E+13














    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    1286.42961

    15643.62168

    0.08223349

    ПП

    0.658080318

    0.031533476

    20.86925995



    Рисунок 6. Фрагмент регрессионного анализа для короткой (однофакторной) регрессии

    3) Вычислим F-статистику

    ,



    4) Так как , отдаем предпочтение длинной регрессии

    .
    2) пошаговый отбор факторов методом исключения из модели статистически незначимых переменных;

    3) проверка теста на «длинную» и «короткую» регрессии (при несоответствии результатов, полученных в пунктах 1 и 2).

    2. Построение модели множественной регрессии с выбранными факторами, экономический анализ коэффициентов уравнения.

    3. Оценку качества модели регрессии:

    1) проверка статистической значимости уравнения с помощью F-критерия Фишера;

    2) проверка предпосылки МНК о гомоскедастичности остатков;

    3) оценка уровня точности модели.
    1) Проверка статистической значимости уравнения с помощью F-критерия Фишера

    Расчетное значение F-критерия Фишера можно найти в регрессионном анализе (рисунок 7).

    Дисперсионный анализ

     

     

     

     







    df

    SS

    MS

    F

    Значимость F

    Регрессия




    1.04794E+13

    3.49313E+12

    162.6049796

    2.56059E-39

    Остаток




    2.25564E+12




     

     

    Итого




    1.2735E+13

     

     

     

    Рисунок 7. Фрагмент трехфакторного регрессионного анализа

     .

    Так как   , то уравнение трехфакторной регрессии статистически значимо на 95% уровне значимости. Таким образом, связь ЧП с включенными в модель факторами существенна.

    2) Проверка предпосылки МНК о гомоскедастичности остатков

    При проверке предпосылки МНК о гомоскедастичности остатков в модели множественной регрессии следует вначале определить, по отношению к какому из факторов дисперсия остатков более всего нарушена. Это можно сделать в результате визуального исследования графиков остатков, построенных по каждому из факторов, включенных в модель. Та из объясняющих переменных, от которой больше зависит дисперсия случайных возмущений, и будет упорядочена по возрастанию фактических значений при проверке теста Голдфельда-Квандта.

    Для трехфакторной модели нашего примера графики остатков относительно каждого из трех факторов имеют вид, представленный на рисунке (эти графики легко получить в отчете, который формируется в результате использования инструмента Регрессия в пакете Анализ данных).







    Рисунок 8. Графики остатков по каждому из факторов трехфакторной модели

     

    На каждой из диаграмм ярко выражена направленность в распределении остатков, то есть непостоянство их дисперсии. В таком случае предпосылку о гомоскедастичности остатков следует проверять трижды, каждый раз упорядочивая значения переменных по возрастанию одного из факторов. Начнем с фактора, который имеет самое большое значение t-статистики, то есть с фактора ПП (t=10,282).
    Основные этапы теста Голдфельда-Квандта:

    1. Упорядочим переменные Y – ЧП,   – ОС,   – КО по возрастанию фактора   – ПП (в Excel для этого можно использовать команду Данные – Сортировка – По возрастанию   ).

    2. Уберем из середины упорядоченной совокупности С=1/4*n=1/4*109   27 значений. В результате получим две совокупности по ½*(109-27)=41 значению соответственно с малыми и большими значениями   .

    3. Для каждой совокупности в отдельности выполним регрессионный анализ (рисунок 9).

     

     

    Для первой совокупности:

    Дисперсионный анализ

     

     







    df

    SS

    MS

    Регрессия










    Остаток




    2.04901E+11




    Итого




    2.27839E+11

     

     

     

     

     




    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    10965.13577

    13026.38488

    0.841763534

    ОС

    0.002340442

    0.040854765

    0.057286887

    КО

    -0.09932818

    0.057414794

    -1.730010202

    ПП

    -0.220959047

    0.120684593

    -1.830880326

     

    Для второй совокупности:

    Дисперсионный анализ

     

     







    df

    SS

    MS

    Регрессия




    9.15293E+12

    3.05098E+12

    Остаток




    1.35495E+12




    Итого




    1.05079E+13

     

     

     

     

     




    Коэффициенты

    Стандартная ошибка

    t-статистика

    Y-пересечение

    -72702.62526

    38053.26016

    -1.910549187

    ОС

    -0.057544265

    0.022085349

    -2.60554026

    КО

    0.029880567

    0.034694784

    0.861240878

    ПП

    0.869087051

    0.10222039

    8.50209095

    Рисунок 9. Фрагменты регрессионного анализа для первой и второй совокупностей соответственно

     

    4. Найдем отношение полученных остаточных сумм квадратов (в числителе должна быть большая сумма):

    R=1.35495Е+12/2,04901Е+11=

    6,612694

     

    5. Вывод о наличии гомоскедастичности остатков делаем с помощью F-критерия Фишера с уровнем значимости   и двумя одинаковыми степенями свободы   (здесь р – число параметров (коэффициентов) в уравнении регрессии):

     .

    Так как   , то обнаруживается наличие гетероскедастичности в остатках модели по отношению к фактору   .

    Аналогично обнаруживается наличие гетероскедастичности в остатках при упорядочении значений переменных по каждому из двух оставшихся факторов   и   . Эти процедуры проводятся в полном соответствии с рассмотренной процедурой. Мы их опускаем.

     


    4. Построение доверительных интервалов для результирующей переменной и определение компаний с заниженным и завышенным фактическим уровнем энерговооруженности (производительности «у»). Ранжирование компаний по степени их эффективности на основе результатов моделирования.

    5. Оценку степени влияния факторов на результат с помощью коэффициентов эластичности, и коэффициентов. Выбор наиболее влияющего фактора.

    6. Построение парной регрессии с наиболее влияющим фактором. Сравнение качества множественной и парной регрессий.

    7. Прогнозирование энерговооруженности (производительности ) на основе модели парной регрессии с вероятностью 95% при условии, что прогнозное значение фактора увеличится на 10% относительно его среднего значения.

    8. Графическое представление результатов моделирования.


    Список литературы



    написать администратору сайта