Тема 7 «Регрессионный анализ»
Задача 1. Рассчитать параметры уравнения парной линейной регрессии. Регрессионный анализ заключается в определении аналитического выражения связи между факторными и результативным признаками. Линейная связь между факторным ( ) и результативным ( ) признаками является парной линейной регрессией. Исходные данные для построения парной линейной регрессии приведены в таблице 1. Таблица 1 – Исходные данные Территории
федерального округа
| Расходы консолидированных бюджетов субъектов РФ ,
млрд. руб.
| Доходы консолидированных бюджетов субъектов РФ ,
млрд. руб.
| Республика Карелия
| 9,86
| 8,49
| Республика Коми
| 17,28
| 16,34
| Архангельская обл.
| 18,78
| 18,28
| Вологодская обл.
| 16,75
| 16,85
| Калининградская обл.
| 9,71
| 9,32
| Ленинградская обл.
| 18,97
| 18,1
| Мурманская обл.
| 13,68
| 12,42
| Новгородская обл.
| 6,36
| 5,95
| Псковская обл.
| 7,51
| 7,05
|
Парная линейная регрессия описывается линейной функцией вида:
(1)
Оценка параметров уравнений регрессии и производится решением системы нормальных уравнений методом наименьших квадратов:
, (2)
где n – объем исследуемой совокупности.
Для решения системы нормальных уравнений приведем данные таблицы 1 к виду таблицы 2. Таблица 2 – К расчету коэффициентов парной линейной регрессии
Регион
| у
| х
| y*x
| (y-yc)^2
| (x-xc)^2
| x^2
| Республика Карелия
| 9,86
| 8,49
| 83,7114
| 11,22995
| 16,34854
| 72,0801
| Республика Коми
| 17,28
| 16,34
| 282,3552
| 16,55586
| 14,49071
| 266,9956
| Архангельская обл.
| 18,78
| 18,28
| 343,2984
| 31,01252
| 33,02418
| 334,1584
| Вологодская обл.
| 16,75
| 16,85
| 282,2375
| 12,52373
| 18,63361
| 283,9225
| Калининградская обл.
| 9,71
| 9,32
| 90,4972
| 12,25778
| 10,32551
| 86,8624
| Ленинградская обл.
| 18,97
| 18,1
| 343,357
| 33,1648
| 30,98778
| 327,61
| Мурманская обл.
| 13,68
| 12,42
| 169,9056
| 0,219857
| 0,012844
| 154,2564
| Новгородская обл.
| 6,36
| 5,95
| 37,842
| 46,93772
| 43,34028
| 35,4025
| Псковская обл.
| 7,51
| 7,05
| 52,9455
| 32,50267
| 30,06694
| 49,7025
| всего
| 118,9
| 112,8
| 1686,15
| 196,4049
| 197,2304
| 1610,99
|
Тогда система нормальных уравнений приобретает вид:
Выводя из первого уравнения и подставляя полученное выражение во второе уравнение, получим:
Производя почленное умножение и раскрывая скобки, получим:
Откуда:
Тогда:
Окончательно уравнение парной линейной регрессии, связывающее размер годового оборота розничной торговли ( ) со среднегодовой численностью экономически активного населения территории ( ) имеет вид:
(3) Задача 2. Определить статистическую значимость параметра уравнения регрессии. Оценка адекватности модели линейного уравнения парной регрессии начинается с проверки значимости коэффициента регрессии с помощью t - критерия Стьюдента:
, (4)
где - дисперсия коэффициента парной линейной регрессии.
Параметр уравнения регрессии признается статически значимым, если выполняется условие:
> , (5)
где - уровень значимости; - число степеней свободы.
Число степеней свободы характеризует число свободно варьирующих элементов совокупности и определяется по формуле:
, (6)
где - количество параметров уравнения регрессии.
Значение может быть определено с помощью статистической функции СТЬЮДЕНТ.ОБР.2Х табличного процессора MS Excel.
Рисунок 1 – Определение с помощью СТЬЮДЕНТ.ОБР.2Х Таким образом, при = 0,05 и = 7 значение = 2,36.
Дисперсию приближенно можно определить по зависимости:
, (7)
где - дисперсия результативного признака в совокупности.
Значение дисперсии рассчитывается по формуле:
, (8)
где - среднее значение результативного признака в совокупности.
Значение дисперсии можно определить с помощью стандартной статистической функции ДИСП.Г табличного процессора Excel:
Рисунок 3 - Расчет дисперсии результативного признака с помощью ДИСП.Г Таким образом, = 21,82.
Так как (0,212) < (2,36), то параметр уравнения регрессии статистически не значим. Задача 3. Оценить с помощью F-критерия Фишера адекватность полученного уравнения регрессии. Проверка адекватности уравнения парной линейной регрессии в целом осуществляется с помощью расчета F - критерия Фишера. Расчетное значение критерия Фишера определяется по зависимости:
, (9)
где - факторная дисперсия; - остаточная дисперсия.
Факторная дисперсия рассчитывается по формуле:
, (9)
где - значение результативного признака, рассчитанное по линейному уравнению регрессии; - число степеней свободы.
млрд. руб.
млрд. руб.
млрд. руб. и т.д.
Среднее значение результативного признака определяется по формуле:
(10)
млрд. руб.
Число степеней свободы определяется по формуле:
(11)
Остаточная дисперсия рассчитывается по формуле:
(12)
Для определения расчетного значения критерия Фишера, средней ошибки аппроксимации и коэффициента эластичности построим таблицу 3. Таблица 3 – К расчету F-критерия Фишера, средней ошибки аппроксимации и коэффициента эластичности № п/п
|
|
|
|
|
|
|
|
| 1
| 9,86
| 8,49
| 9,201578
| -4,00953
| 16,07636
| 0,658422
| 0,43352
| 0,066777
| 2
| 17,28
| 16,34
| 16,99035
| 3,779237
| 14,28263
| 0,289652
| 0,083898
| 0,016762
| 3
| 18,78
| 18,28
| 18,91522
| 5,704105
| 32,53681
| -0,13522
| 0,018283
| 0,0072
| 4
| 16,75
| 16,85
| 17,49637
| 4,285259
| 18,36344
| -0,74637
| 0,557068
| 0,044559
| 5
| 9,71
| 9,32
| 10,0251
| -3,18601
| 10,15064
| -0,3151
| 0,099291
| 0,032451
| 6
| 18,97
| 18,1
| 18,73662
| 5,525509
| 30,53125
| 0,23338
| 0,054466
| 0,012303
| 7
| 13,68
| 12,42
| 13,10092
| -0,11019
| 0,012141
| 0,579076
| 0,335329
| 0,04233
| 8
| 6,36
| 5,95
| 6,68139
| -6,52972
| 42,63726
| -0,32139
| 0,103292
| 0,050533
| 9
| 7,51
| 7,05
| 7,77281
| -5,4383
| 29,57512
| -0,26281
| 0,069069
| 0,034995
| Итого
| 118,9
| 112,8
| 118,9204
|
| 194,1657
|
| 1,754216
| 0,307911
|
К ритическое значение критерия Фишера может быть определено с помощью статистической функции F.ОБР.ПХ табличного процессора MS Excel.
Рисунок 1 – Определение с помощью F.ОБР.ПХ Таким образом, при = 0,05, и значение = 5,6.
Так как (27,81) > (5,6), то гипотеза о несоответствии заложенных в уравнении регрессии связей реально существующим H0 отвергается. Задача 4. Определить среднюю ошибку аппроксимации. Значение средней ошибки аппроксимации определяется по зависимости:
(13)
Значение средней ошибки аппроксимации не должно превышать 12 - 15%. Задача 5. На основе использования коэффициента эластичности выполнить количественную оценку влияния факторного признака на результативный.
Коэффициент эластичности рассчитывается по формуле:
, (14)
где - среднее значение факторного признака в совокупности.
Среднее значение факторного признака определяется по формуле:
(15)
млн. чел.
Коэффициент эластичностипоказывает, на сколько процентов в среднем изменится значение результативного при изменении факторного признака на 1%.
|