Лабораторные. Лабораторная работа 1 предполагает сбор (с сайта Росстата) и оформление в виде таблиц данных по следующим показателям
Скачать 204.78 Kb.
|
Лабораторная работа 3Построение множественной линейной регрессии. Исследование зависимости темпов роста ВРП (У) темпов роста тех переменных, которые по итогам Лаб.1 показали наиболее тесную связь (Х1) и (Х2) Количество показателей: три. Количество наблюдений (выборка): не менее 22. 1) Студент использует ту же выборку, что и в лабораторной работе 2. Плюс в качестве второй независимой переменной (Х2) студент включает в модель еще одну переменную, с которой из оставшихся расчет корреляции показал самую тесную связь. 2) При помощи пакета анализа студент строит линейную регрессию, получает «вывод итогов», в котором акцентирует внимание на параметрах уравнения регрессии. Выводит само уравнение регрессии. 3) Проверяет полученную модель на наличие мультиколлинеарности. Делает выводы. 4) Далее студент проверяет полученное уравнение регрессии на адекватность: 4.1. анализирует полученный коэффициент детерминации; 4.2. проверяет значимость параметров уравнения при помощи t-статистики; 5.3. проверяет значимость уравнения (коэффициента детерминации) при помощи F-статистики. Зависимая переменная: Y - ВРП млн. руб. Независимые переменные: Х1 - Инвестиции в основной капитал, млн. руб. Х2 - Стоимость основных фондов, млн. руб. Таблица 6 – Исходные данные
При помощи пакета анализа (инструмент Регрессия) получаем «Вывод итогов»
Рис. 3 Результат регрессионного анализа Эмпирическое уравнение множественной регрессии представим в виде: Y = b0 + b1х1 + b2х2 + e b0 = -30764,61 b1 = 3,00 b2 = 0,22 Уравнение регрессии (оценка уравнения регрессии) Y = -30764.61 + 3.00X1 + 0.22X2 Интерпретация коэффициентов регрессии. Константа оценивает агрегированное влияние прочих (кроме учтенных в модели хi) факторов на результат Y и означает, что Y при отсутствии xi составила бы -30764.7427. Коэффициент b1 указывает, что с увеличением x1 на 1, Y увеличивается на 3.0045. Коэффициент b2 указывает, что с увеличением x2 на 1, Y увеличивается на 0.2231. Анализ мультиколлинеарности на основе матрицы коэффициентов корреляции. Если в матрице парных коэффициентов корреляции есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность. Строим матрицу парных коэффициентов корреляции
В нашем случае r(x1x2) имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа (рекомендуется). Анализ коэффициента детерминации R2= 0.9602 (таблица Регрессионная статистика на рис. 3) Более объективной оценкой является скорректированный (нормированный) коэффициент детерминации: Нормированный R-квадрат = 0,956 Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации. Можно сказать, что в исследуемой ситуации 96.02% общей вариабельности Y объясняется изменением факторов Xj. Проверка значимость параметров уравнения при помощи t-статистики 1) t-статистика tтабл (n-m-1;α) = =СТЬЮДЕНТ.ОБР.2Х(0,05;21) = 2.08 Sbi – столбец «Стандартная ошибка» в таблице «Дисперсионный анализ» на рис.3 |t0| = 1,05 > 2,08 (столбец «t-статистика» в таблице «Дисперсионный анализ» на рис.3) Статистическая значимость коэффициента регрессии b0 не подтверждается. |t1| = 5,95 > 2,08 Статистическая значимость коэффициента регрессии b1 подтверждается. |t2| = 6,64 > 2,08 Статистическая значимость коэффициента регрессии b2 подтверждается. Такие же выводы можно сделать на основании столбца «Р-значение» в таблице «Дисперсионный анализ» на рис.3. Если величина P-значения больше принятого уровня значимости α = 0,05, то можно сказать, что данный коэффициент статистически незначим. Проверка значимости уравнения (коэффициента детерминации) при помощи F-статистики. F-статистика. Критерий Фишера. Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных: H0: R2 = 0; β1 = β2 = ... = βm = 0. H1: R2 ≠ 0. Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка). Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0. Это значение в столбце «F» в таблице «Дисперсионный анализ» на рис.3 Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 24 - 2 - 1 = 21, =FРАСПОБР(0,05;2;21) = 3.47 Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно (т.е. коэффициенты bi совместно значимы). Выводы В результате расчетов было получено уравнение множественной регрессии: Y = -30764.62 + 3.00X1 + 0.22X2. Возможна экономическая интерпретация параметров модели: увеличение X1 на 1 ед. изм. приводит к увеличению Y в среднем на 3.00 ед. изм.; увеличение X2 на 1 ед. изм. приводит к увеличению Y в среднем на 0.22 ед. изм. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 96.02% общей вариабельности Y объясняется изменением факторов Xj. Установлено также, что один параметр модели статистически не значим и в данной модели множественной регрессии существует мультиколлинеарность. |