Эконометрика. Задание Парная регрессия и корреляция
Скачать 119.8 Kb.
|
Содержание Задание 1 . . . . . . . . . . 3 Задание 2 . . . . . . . . . . 17 Задание 3 . . . . . . . . . . 31 Список литературы . . . . . . . . Задание № 1. Парная регрессия и корреляция Построить поле корреляции и сформулировать гипотезу о форме связи. Рассчитать параметры следующих функций: А) линейной Б) степенной В) показательной Г) равносторонней гиперболы 3. Оценить тесноту связи с помощью показателей корреляции и детерминации. 4. Оценить качество уравнений с помощью средней ошибки аппроксимации. 5. Оценить статистическую надежность результатов регрессионного моделирования в целом (F-критерий Фишера) и параметров регрессии в отдельности (t-критерий Стьюдента). Выбрать лучшее уравнение регрессии и обосновать его. 6. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05. 7. Оценить полученные результаты. Оформить выводы в аналитической записке. Таблица 1.1 Исходные данные
Решение: Линейная функция. Для расчета параметров линейной регрессии у=а+в*х решаем систему нормальных уравнений относительно а и в. По исходным данным рассчитываем Таблица 1.2
= Уравнение регрессии: у = а + вх = 4588,19 + 0,28х С увеличением прожиточного минимума на 1 рубль средний размер пенсии увеличивается на 0,28 рублей. Рассчитаем линейный коэффициент парной корреляции: Связь сильная, прямая. Определим коэффициент детерминации: Вариация результата на 65,6 % определяется вариацией фактора х. Найдем величину средней ошибки аппроксимации : % В среднем расчетные значения отклоняются от фактических на 2,095 %. Рассчитаем F-критерий: F = 0.656/0.344*16=30,51 F-критерий табличный равен 4,49; соответственно уравнение статистически значимое. Рассчитаем t-критерий Стьюдента: Определим случайные ошибки ma, mb, mr. ma= mb= 0.000003 mr= Тогда, ta= tb= tr= Фактические значения превосходят табличные значения (ta,tb,tr ≥ 2,1199), значит уравнение статистически значимо. Рисунок 1. Поле корреляции. Степенная функция. y=a*xb Таблица 1.3
Рассчитаем С и в: b= C= =3.7739-0.25*3.6814=2,8535 Y= 2,8535+0,25*х Уравнение регрессии равно: y = 716.34x0.25 Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Рассчитаем индекс корреляции: Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии. Рассчитаем индекс детерминации. Вариация результата на 66 % определяется вариацией фактора х. Найдем величину средней ошибки аппроксимации : % В среднем расчетные значения отклоняются от фактических на 39,4 %. Рассчитаем F-Критерий Фишера: Табличное значение критерия со степенями свободы k1=1 и k2=16, Fтабл = 4.49 F-критерий табличный равен 4,49; соответственно уравнение статистически значимое. Рассчитаем t-Критерий Стьюдента: tкрит (n-m-1;α/2) = (16;0.025) = 2.12 Доверительный интервал для коэффициентов уравнения регрессии. (b - tкрит Sb; b + tкрит Sb) (a - tкрит Sa; a + tкрит Sa) Уравнение статистически значимо. Рисунок 2. Поле и уравнение степенной функции Показательная функция. На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит показательный характер. Показательное уравнение регрессии имеет вид y = a bx + ε
В= А= =3.7739-0,00002*4851,8889=3,6769 Y= 2,8535+0,00002*х Рассчитаем индекс корреляции: Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии. Рассчитаем индекс детерминации: Вариация результата на 66 % определяется вариацией фактора х. Найдем величину средней ошибки аппроксимации : % В среднем расчетные значения отклоняются от фактических на 2,5 %. Рассчитаем F-Критерий Фишера: Табличное значение критерия со степенями свободы k1=1 и k2=16, Fтабл = 4.49 F-критерий табличный равен 4,49; соответственно уравнение статистически значимое. Рассчитаем t-Критерий Стьюдента: tкрит (n-m-1;α/2) = (16;0.025) = 2.12 Доверительный интервал для коэффициентов уравнения регрессии. (b - tкрит Sb; b + tкрит Sb) (a - tкрит Sa; a + tкрит Sa) Уравнение статистически значимое. Рисунок 3. Поле и уравнение показательной функции Равносторонняя гипербола. Гиперболическое уравнение регрессии имеет вид y = b/x + a + ε Таблица 1.5
В= А= =5946.7167-551000*0.0002=5836.5167 Y= 5836.5167+551000*z Рассчитаем индекс корреляции: Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.82. Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии. Рассчитаем индекс детерминации: R2= 0.8992 = 0.81 Вариация результата на 81 % определяется вариацией фактора х. Найдем величину средней ошибки аппроксимации : % В среднем расчетные значения отклоняются от фактических на 28,7%. Рассчитаем F-Критерий Фишера: Табличное значение критерия со степенями свободы k1=1 и k2=16, Fтабл = 4.49 F-критерий табличный равен 4,49; соответственно уравнение статистически значимое. Рассчитаем t-Критерий Стьюдента: tкрит (n-m-1;α/2) = (16;0.025) = 2.12 Доверительный интервал для коэффициентов уравнения регрессии. (b - tкрит Sb; b + tкрит Sb) (a - tкрит Sa; a + tкрит Sa) Уравнение статистически значимое. Анализируя полученные результаты, наиболее лучшее уравнение регрессии – это равносторонняя гипербола. Прогнозное значение результата: Х прогнозное = 7939,45*1,1 = 8733,395 У прогнозное = (a + bxp ± ε) где Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 5337 Индивидуальные доверительные интервалы для Y при данном значении X. (a + bxi ± ε) где tкрит (n-m-1;α/2) = (16;0.025) = 2.12 Анализ полученных результатов. Проведя анализ полученных результатов можно сделать вывод о наличии достаточно тесной связи между рассматриваемыми признаками: прожиточным минимумом и средней пенсией Центрального федерального округа. Наиболее лучшее уравнение регрессии для исходных данных для составления прогнозных значений является уравнение равносторонней гиперболы. |