Главная страница
Навигация по странице:

  • Анализ мультиколлинеарности на основе матрицы коэффициентов корреляции.

  • Проверка значимость параметров уравнения при помощи t-статистики

  • Проверка значимости уравнения (коэффициента детерминации) при помощи F-статистики.

  • Лабораторные. Лабораторная работа 1 предполагает сбор (с сайта Росстата) и оформление в виде таблиц данных по следующим показателям


    Скачать 204.78 Kb.
    НазваниеЛабораторная работа 1 предполагает сбор (с сайта Росстата) и оформление в виде таблиц данных по следующим показателям
    Дата01.09.2022
    Размер204.78 Kb.
    Формат файлаdocx
    Имя файлаЛабораторные.docx
    ТипЛабораторная работа
    #658922
    страница3 из 4
    1   2   3   4

    Лабораторная работа 3


    Построение множественной линейной регрессии. Исследование зависимости темпов роста ВРП (У) темпов роста тех переменных, которые по итогам Лаб.1 показали наиболее тесную связь (Х1) и (Х2)
    Количество показателей: три.

    Количество наблюдений (выборка): не менее 22.

    1) Студент использует ту же выборку, что и в лабораторной работе 2. Плюс в качестве второй независимой переменной (Х2) студент включает в модель еще одну переменную, с которой из оставшихся расчет корреляции показал самую тесную связь.

    2) При помощи пакета анализа студент строит линейную регрессию, получает «вывод итогов», в котором акцентирует внимание на параметрах уравнения регрессии. Выводит само уравнение регрессии.

    3) Проверяет полученную модель на наличие мультиколлинеарности. Делает выводы.

    4) Далее студент проверяет полученное уравнение регрессии на адекватность:

    4.1. анализирует полученный коэффициент детерминации;

    4.2. проверяет значимость параметров уравнения при помощи t-статистики; 5.3. проверяет значимость уравнения (коэффициента детерминации) при помощи F-статистики.
    Зависимая переменная:

    Y - ВРП млн. руб.

    Независимые переменные:

    Х1 - Инвестиции в основной капитал, млн. руб.

    Х2 - Стоимость основных фондов, млн. руб.

    Таблица 6 – Исходные данные

    ВРП млн. руб.

    Инвестиции в основной капитал, млн. руб.

    Стоимость основных фондов, млн. руб.

    Y

    X1

    X2

    18 245,5

    8965

    132564

    32 060,6

    9110

    149876

    42 074,5

    9242

    154391

    49 941,8

    14031

    173840

    62 404,4

    10830

    214329

    76 054,5

    15336

    247369

    114 409,3

    22685

    264218

    144 987,8

    35022

    295272

    178 846,1

    52073

    332176

    237 013,3

    83510

    425857

    317 656,3

    104218

    507024

    304 345,3

    73127

    586006

    398 361,4

    96313

    671563

    507 839,8

    125994

    797428

    545 517,2

    136820

    921456

    569 006,4

    129405

    1035534

    619 677,7

    120658

    1152400

    693 379,4

    147214

    1289717

    778 027,8

    143792

    1400837

    837 306,8

    142693

    1501847

    911 597,9

    134551

    1564553

    955 329,2

    167093

    2858983

    999 081,6

    168123

    2928570

    1 270 000,0

    165671,7

    2999851


    При помощи пакета анализа (инструмент Регрессия) получаем «Вывод итогов»


    ВЫВОД ИТОГОВ








































    Регрессионная статистика
















    Множественный R

    0,979873408
















    R-квадрат

    0,960151896
















    Нормированный R-квадрат

    0,956356838
















    Стандартная ошибка

    77402,52232
















    Наблюдения

    24





































    Дисперсионный анализ



















     

    df

    SS

    MS

    F

    Значимость F




    Регрессия

    2

    3,03E+12

    1,52E+12

    253,0006

    2,02E-15




    Остаток

    21

    1,26E+11

    5,99E+09










    Итого

    23

    3,16E+12

     

     

     

























     

    Коэффициенты

    Стандартная ошибка

    t-статистика

    P-Значение

    Нижние 95%

    Верхние 95%

    Y-пересечение

    -30764,61197

    29268,61

    -1,05111

    0,305153

    -91632

    30102,79

    X1

    3,004511773

    0,504767

    5,952279

    6,59E-06

    1,954792

    4,054231

    X2

    0,223065379

    0,0336

    6,638853

    1,43E-06

    0,15319

    0,29294

    Рис. 3 Результат регрессионного анализа
    Эмпирическое уравнение множественной регрессии представим в виде:

    Y = b0 + b1х1 + b2х2 + e

    b0 = -30764,61

    b1 = 3,00

    b2 = 0,22

    Уравнение регрессии (оценка уравнения регрессии)

    Y = -30764.61 + 3.00X1 + 0.22X2

    Интерпретация коэффициентов регрессии. Константа оценивает агрегированное влияние прочих (кроме учтенных в модели хi) факторов на результат Y и означает, что Y при отсутствии xi составила бы -30764.7427. Коэффициент b1 указывает, что с увеличением x1 на 1, Y увеличивается на 3.0045. Коэффициент b2 указывает, что с увеличением x2 на 1, Y увеличивается на 0.2231.
    Анализ мультиколлинеарности на основе матрицы коэффициентов корреляции.

    Если в матрице парных коэффициентов корреляции есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.

    Строим матрицу парных коэффициентов корреляции

     

    Y

    X1

    X2

    Y

    1

     

     

    X1

    0,936226

    1

     

    X2

    0,944946

    0,843304

    1


    В нашем случае r(x1x2) имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа (рекомендуется).
    Анализ коэффициента детерминации

    R2= 0.9602 (таблица Регрессионная статистика на рис. 3)

    Более объективной оценкой является скорректированный (нормированный) коэффициент детерминации:

    Нормированный R-квадрат = 0,956

    Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.

    Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

    Можно сказать, что в исследуемой ситуации 96.02% общей вариабельности Y объясняется изменением факторов Xj.
    Проверка значимость параметров уравнения при помощи t-статистики

    1) t-статистика

    tтабл (n-m-1;α) = =СТЬЮДЕНТ.ОБР.2Х(0,05;21) = 2.08
    Sbi – столбец «Стандартная ошибка» в таблице «Дисперсионный анализ» на рис.3

    |t0| = 1,05 > 2,08 (столбец «t-статистика» в таблице «Дисперсионный анализ» на рис.3)

    Статистическая значимость коэффициента регрессии b0 не подтверждается.

    |t1| = 5,95 > 2,08

    Статистическая значимость коэффициента регрессии b1 подтверждается.

    |t2| = 6,64 > 2,08

    Статистическая значимость коэффициента регрессии b2 подтверждается.

    Такие же выводы можно сделать на основании столбца «Р-значение» в таблице «Дисперсионный анализ» на рис.3. Если величина P-значения больше принятого уровня значимости α = 0,05, то можно сказать, что данный коэффициент статистически незначим.
    Проверка значимости уравнения (коэффициента детерминации) при помощи F-статистики.

    F-статистика. Критерий Фишера.

    Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

    H0: R2 = 0; β1 = β2 = ... = βm = 0.

    H1: R2 ≠ 0.

    Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).

    Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
    Это значение в столбце «F» в таблице «Дисперсионный анализ» на рис.3

    Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 24 - 2 - 1 = 21, =FРАСПОБР(0,05;2;21) = 3.47

    Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно (т.е. коэффициенты bi совместно значимы).
    Выводы

    В результате расчетов было получено уравнение множественной регрессии:

    Y = -30764.62 + 3.00X1 + 0.22X2.

    Возможна экономическая интерпретация параметров модели: увеличение X1 на 1 ед. изм. приводит к увеличению Y в среднем на 3.00 ед. изм.; увеличение X2 на 1 ед. изм. приводит к увеличению Y в среднем на 0.22 ед. изм. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 96.02% общей вариабельности Y объясняется изменением факторов Xj. Установлено также, что один параметр модели статистически не значим и в данной модели множественной регрессии существует мультиколлинеарность.

    1   2   3   4


    написать администратору сайта