эконометрика. Линейные, нелинейные и множественные регрессии студент II курса
Скачать 120.87 Kb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ, КУЛЬТУРЫ И ИССЛЕДОВАНИЙ РЕСПУБЛИКИ МОЛДОВА Дисциплина: «Эконометрика» Индивидуальная работа на тему: «Линейные, нелинейные и множественные регрессии» выполнил: студент II курса группы BA-174 Ff Проверил: Кишинёв, 2019 СОДЕРЖАНИЕ
Данные каждого варианта определяется параметрами p1, p2. При выполнении контрольных заданий студент должен подставить там, где это необходимо, вместо буквенных параметров индивидуальные анкетные характеристики: p1 – Номер студента последовательности в каталоге группы; p2 – последние две цифры в студенческом билете. p 1 - 24 p 2 – 21
По имеющимся данным исследуется зависимость между Производство продукции и Среднегодовая стоимость основных производственных фондов.
Требуется: 1. Построить линейное уравнение парной регрессии y по x. 2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента. p=95% 4. Выполнить прогноз производство продукции при прогнозном Среднегодовая стоимость основных производственных фондов, составляющем 55 млн. 5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. p=90% 6. На одном графике отложить исходные данные и теоретическую прямую. 7. Тест на гетероскедастичность – Графический анализ. Tест Гельфельда-Квандта, p=99% 8. Автокорреляция 1-го порядка и критерий Дарбина-Уотсона. α = 0,05 9. Проверить вычисления в MS Excel. Вывод и интерпретация. 1. Построить линейное уравнение парной регрессии y по x. Линейное уравнение регрессии имеет вид y = bx + a Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
Параметры уравнения регрессии. Выборочные средние. Выборочные дисперсии: = = Среднеквадратическое отклонение Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно: Уравнение регрессии (эмпирическое уравнение регрессии): y = 0.9834 x -40.5191 2. Рассчитать линейный коэффициент парной корреляции,коэффициент детерминации и среднюю ошибку аппроксимации. Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле: Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < rxy < 0.3: слабая; 0.3 < rxy < 0.5: умеренная; 0.5 < rxy < 0.7: заметная; 0.7 < rxy < 0.9: высокая; 0.9 < rxy < 1: весьма высокая; В нашем примере связь между признаком Y и фактором X высокая и прямая. Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b: Коэффициент детерминации. Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах. R2= 0.8972 = 0.8038 т.е. в 80.38% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 19.62% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации). Ошибка аппроксимации. Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических: Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. В среднем, расчетные значения отклоняются от фактических на 14.3%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии. 3. Оценить статистическую значимость уравнения регрессии вцелом и отдельных параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента. p=95% Несмещенной оценкой дисперсии возмущений является величина: S2 = 26.733 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии). S = 5.17 - стандартная ошибка оценки. Стандартная ошибка регрессии рассматривается в качестве меры разброса данных наблюдений от смоделированных значений. Чем меньше значение стандартной ошибки регрессии, тем качество модели выше. Sa - стандартное отклонение случайной величины a. Sb - стандартное отклонение случайной величины b. |