Тема 6 «Корреляционный анализ»
Задача 1. Рассчитать линейный коэффициент корреляции. Корреляционный анализ направлен на измерение тесноты и направления связи между факторным ( ) и результативным ( ) признаками. Количественно оценить тесноту и направление связи между двумя признаками при парной корреляции в случае наличия между ними линейной зависимости можно посредством расчета линейного коэффициента корреляции.
Исходные данные, распределение которых близко к нормальному, для расчета линейной коэффициента корреляции приведены в таблице 1. Таблица 1 – Исходные данные Территории
федерального округа
| Расходы консолидированных бюджетов субъектов РФ ,
млрд. руб.
| Доходы консолидированных бюджетов субъектов РФ ,
млрд. руб.
| Республика Карелия
| 9,86
| 8,49
| Республика Коми
| 17,28
| 16,34
| Архангельская обл.
| 18,78
| 18,28
| Вологодская обл.
| 16,75
| 16,85
| Калининградская обл.
| 9,71
| 9,32
| Ленинградская обл.
| 18,97
| 18,1
| Мурманская обл.
| 13,68
| 12,42
| Новгородская обл.
| 6,36
| 5,95
| Псковская обл.
| 7,51
| 7,05
|
Линейный коэффициент корреляции определяется по формуле:
, (1)
где - среднее значение факторного признака; - среднее значение результативного признака; - среднее значение из произведений средних величин факторного и результативного признака; - среднее квадратическое отклонение факторного признака; - среднее квадратическое отклонение результативного признака.
Для удобства промежуточных расчетов перестроим таблицу 1 в таблицу 2. Таблица 2 – К расчету линейного коэффициента корреляции
Регион
| у
| х
| y*x
| (y-yc)^2
| (x-xc)^2
| x^2
| Республика Карелия
| 9,86
| 8,49
| 83,7114
| 11,22995
| 16,34854
| 72,0801
| Республика Коми
| 17,28
| 16,34
| 282,3552
| 16,55586
| 14,49071
| 266,9956
| Архангельская обл.
| 18,78
| 18,28
| 343,2984
| 31,01252
| 33,02418
| 334,1584
| Вологодская обл.
| 16,75
| 16,85
| 282,2375
| 12,52373
| 18,63361
| 283,9225
| Калининградская обл.
| 9,71
| 9,32
| 90,4972
| 12,25778
| 10,32551
| 86,8624
| Ленинградская обл.
| 18,97
| 18,1
| 343,357
| 33,1648
| 30,98778
| 327,61
| Мурманская обл.
| 13,68
| 12,42
| 169,9056
| 0,219857
| 0,012844
| 154,2564
| Новгородская обл.
| 6,36
| 5,95
| 37,842
| 46,93772
| 43,34028
| 35,4025
| Псковская обл.
| 7,51
| 7,05
| 52,9455
| 32,50267
| 30,06694
| 49,7025
| всего
| 118,9
| 112,8
| 1686,15
| 196,4049
| 197,2304
| 1610,99
|
Среднее значение результативного признака определяется по формуле:
, (2)
где - объем статистической совокупности.
млрд. руб.
Среднее значение факторного признака определяется по формуле:
(3)
млрд. руб.
млрд. руб.
Среднее квадратическое отклонение результативного признака определяется по формуле:
(4)
Среднее квадратическое отклонение факторного признака определяется по формуле:
(5)
Интерпретацию значения линейного коэффициента корреляции проведем в соответствии с критериями оценки тесноты связи, приведенными в таблице 3. Таблица 3 - Количественные критерии оценки тесноты связи Величина коэффициента корреляции
| Характер связи
| до ± 0,3
| практически отсутствует
| ± 0,3…± 0,5
| слабая
| ± 0,5…± 0,7
| умеренная
| ± 0,7…± 1,0
| сильная
|
Поскольку входит в диапазон значений от ± 0,7, до ± 1, то можно утверждать, что связь между доходами консолидированного бюджета субъектов РФ и расходами консолидированного бюджета субъектов РФ сильная. Задача 2. Определить значимость коэффициента корреляции (воспользоваться функцией СТЬЮДЕНТ.ОБР.2Х). Значимость линейного коэффициента корреляции проверяется с помощью t – критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза (Но) о равенстве коэффициента корреляции нулю [Н0: r = 0]. При проверке этой гипотезы используется t – статистика:
, (6)
где - число степеней свободы.
Число степеней свободы характеризует число свободно варьирующих элементов совокупности и определяется по формуле:
, (7)
где - количество параметров уравнения регрессии ( ).
Критическое значение критерия Стьюдента можно определить с помощью статистической функции СТЬЮДЕНТ.ОБР.2Х табличного процессора MS Excel.
Рисунок 1 – Определение с помощью СТЬЮДЕНТ.ОБР.2Х Таким образом, при уровне значимости = 0,05 и числе степеней свободы = 7 критическое значение критерия Стьюдента = 2,36.
Так как (27,87) > (2,36), то гипотеза Н0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, т.е. о статистической существенности зависимости между факторным и результативным признаком в совокупности.
|