Главная страница

Эконометрика. Задание Парная регрессия и корреляция


Скачать 119.8 Kb.
НазваниеЗадание Парная регрессия и корреляция
Дата02.11.2021
Размер119.8 Kb.
Формат файлаdocx
Имя файлаЭконометрика.docx
ТипДокументы
#261418
страница2 из 3
1   2   3
Задание №2 . Множественная регрессия и корреляция


  1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с и , пояснить различия между ними.

  2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.

  3. Рассчитать общий и частные F-критерии Фишера.

  4. Оценить полученные результаты. Оформить выводы в аналитической записке.

Решение:

Таблица 2.1

Исходные данные

Регионы

Прожуточный минимум 2009 г., руб.

Численность пенсионеров, тыс. чел.

Средняя пенсия, руб.

Белгородская область

4172

466

5856

Брянская область

4311

406

5785,6

Владимирская область

4973

452

6048,3

Воронежская область

4924

729

5730,9

Ивановская область

4642

325

5912,8

Калужская область

4583

294

6077,4

Костромская область

4789

207

5852,6

Курская область

4493

376

5568,7

Липецкая область

4563

371

5776

Московская область

5850

1823

6496

Орловская область

4145

262

5938,4

Рязанская область

4868

387

5830,4

Смоленская область

4977

297

5846,1

Тамбовская область

3805

353

5567,2

Тверская область

4968

423

5989,2

Тульская область

4752

555

6026,1

Ярославская область

5113

399

6160,7

г. Москва

7406

2557

6578,5

Система трех линейных уравнений с тремя неизвестными b0, b1, b2:

∑yi = nb0 + b1∑x1i + b2∑x2i

∑x1iyi = b0∑x1i + b1∑x1i2 + b2∑x1ix2i

∑x2iyi = b0∑x2i + b1∑x1ix2i + b2∑x2i2

Таблица 2.2.

Y

X1

X2

X12

X22

X1Y

X2Y

X1X2

Y2

5856

4172

466

17405584

217156

24431232

2728896

1944152

34292736

5785.6

4311

406

18584721

164836

24941721.6

2348953.6

1750266

33473167.36

6048.3

4973

452

24730729

204304

30078195.9

2733831.6

2247796

36581932.89

5730.9

4924

729

24245776

531441

28218951.6

4177826.1

3589596

32843214.81

5912.8

4642

325

21548164

105625

27447217.6

1921660

1508650

34961203.84

6077.4

4583

294

21003889

86436

27852724.2

1786755.6

1347402

36934790.76

5852.6

4789

207

22934521

42849

28028101.4

1211488.2

991323

34252926.76

5568.7

4493

376

20187049

141376

25020169.1

2093831.2

1689368

31010419.69

5776

4563

371

20820969

137641

26355888

2142896

1692873

33362176

6496

5850

1823

34222500

3323329

38001600

11842208

10664550

42198016

5938.4

4145

262

17181025

68644

24614668

1555860.8

1085990

35264594.56

5830.4

4868

387

23697424

149769

28382387.2

2256364.8

1883916

33993564.16

5846.1

4977

297

24770529

88209

29096039.7

1736291.7

1478169

34176885.21

5567.2

3805

353

14478025

124609

21183196

1965221.6

1343165

30993715.84

5989.2

4968

423

24681024

178929

29754345.6

2533431.6

2101464

35870516.64

6026.1

4752

555

22581504

308025

28636027.2

3344485.5

2637360

36313881.21

6160.7

5113

399

26142769

159201

31499659.1

2458119.3

2040087

37954224.49

6578.5

7406

2557

54848836

6538249

48720371

16821224.5

18937142

43276662.25

107040.9

87334

10682

434065038

12570628

522262495.2

65659346.1

58933269

637754628.47

5946.72

4851.89

593.44

24114724.33

698368.22

29014583.07

3647741.45

3274070.5

35430812.69


Для наших данных система уравнений имеет вид:

107040.9 = 18 b0 + 87334b1 + 10682b2

522262495.2 = 87334b0 + 434065038b1 + 58933269b2

65659346.1 = 10682b0 + 58933269b1 + 12570628b2

Решая систему методом Крамера, находим:

b0 = 4851.75

b1 = 0.21

b2 = 0.0994

Уравнение регрессии:

Y = 4851.75 + 0.21 X1 + 0.0994 X2

Таблица 2.3.


Y

X1

X2

(Yi-Yср)2

(X1i-X1ср)2

(X2i-X2ср)2

(Yi-Yср)(X1i-X1ср)

(Yi-Yср)(X2i-X2ср)

(X1i-X1ср)(X2i-X2ср)

5856

4172

466

8229.51

462248.9

16242.09

61677.25

11561.34

86648.06

5785.6

4311

406

25958.58

292560.79

35135.42

87146.21

30200.42

101386.62

6048.3

4973

452

10319.17

14667.9

20006.53

12302.87

-14368.4

-17130.49

5730.9

4924

729

46576.83

5200.01

18375.31

-15562.78

-29255.15

9775.06

5912.8

4642

325

1150.34

44053.35

72062.42

7118.73

9104.74

56343.51

6077.4

4583

294

17078.13

72301.23

89666.98

-35139.3

-39132.4

80517.28

5852.6

4789

207

8857.95

3955.01

149339.31

5918.89

36370.86

24303.06

5568.7

4493

376

142896.6

128801.23

47282.09

135665.98

82197.62

78038.4

5776

4563

371

29144.18

83456.79

49481.53

49318.15

37974.97

64261.73

6496

5850

1823

301712.18

996225.79

1511806.86

548245.8

675374.37

1227233.06

5938.4

4145

262

69.17

499691.9

109855.42

5878.96

2756.51

234294.4

5830.4

4868

387

13529.57

259.57

42619.31

-1873.99

24012.93

-3326.05

5846.1

4977

297

10123.71

15652.79

87879.31

-12588.26

29827.25

-37088.49

5567.2

3805

353

144032.9

1095976.35

57813.53

397311.78

91252.67

251718.62

5989.2

4968

423

1804.83

13481.79

29051.31

4932.79

-7241.05

-19790.49

6026.1

4752

555

6301.71

9977.79

1477.98

-7929.51

-3051.85

3840.17

6160.7

5113

399

45788.87

68179.01

37808.64

55873.43

-41607.87

-50771.6

6578.5

7406

2557

399150.18

6523483.57

3855550.42

1613644.83

1240541.67

5015139.06

107040.9

87334

10682

1212724.42

10330173.78

6231454.44

2911941.83

2136518.67

7105391.89

5946.72

4851.89

593.44

67373.58

573898.54

346191.91

161774.55

118695.48

394743.99


Коэффициенты регрессии bi можно также найти по следующим формулам:

где

ryx1, ryx2, rx1x2 - коэффициенты парной корреляции между результатом и каждым из факторов и между факторами; s(x1), s(x2) - среднее квадратическое отклонение 1-го и 2-го факторов соответственно; s(y) - среднее квадратическое отклонение результативного признака.

Параметр a можно определить по формуле:
Указанные параметры рассчитаны в разделе Оценка мультиколлинеарности факторов.

2. Анализ качества эмпирического уравнения множественной линейной регрессии.

Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

• проверка статистической значимости коэффициентов уравнения регрессии;

• проверка общего качества уравнения регрессии;

• проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК). Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов.

При этом:

где m=2 – количество объясняющих переменных модели.

Стандартные ошибки коэффициентов:


Таблица 2.4

Y(X1,X2)

ei = (Yi-Y(X1,X2))

ei2

ei - ei-1

(ei - ei-1)2

5788.88

67.12

4505.26

0

0

5812.59

-26.99

728.71

94.12

8857.79

5958.52

89.78

8060.85

-116.78

13636.83

5975.59

-244.69

59871.86

334.47

111869.84

5875.22

37.58

1412.31

-282.27

79675.22

5859.54

217.86

47462.84

-180.28

32500.5

5894.88

-42.28

1787.47

260.14

67671.85

5848.47

-279.77

78273.32

237.5

56403.99

5862.92

-86.92

7555.64

-192.85

37191.31

6282.04

213.96

45776.95

-300.88

90527.99

5762.84

175.56

30822.21

38.39

1474.02

5929.64

-99.24

9848.08

274.8

75515.06

5943.97

-97.87

9577.73

-1.37

1.88

5699.29

-132.09

17446.46

34.22

1170.95

5954.57

34.63

1199.39

-166.72

27794.65

5921.57

104.53

10927.12

-69.9

4886.1

5983.14

177.56

31526.52

-73.02

5332.54

6687.24

-108.74

11824.04

286.3

81965.13

107040.9

-0

378606.76

175.86

696475.64

5946.72

0

21033.71

9.77

38693.09


Парные коэффициенты корреляции.

Для y и x1

Средние значения


Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции
Для y и x2

Средние значения


Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции
Для x1 и x2

Средние значения


Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции
Матрица парных коэффициентов корреляции.

-

y

x1

x2

y

1

0.82

0.78

x1

0.82

1

0.89

x2

0.78

0.89

1

При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Для отбора наиболее значимых факторов xi учитываются следующие условия:

- связь между результативным признаком и факторным должна быть выше межфакторной связи;

- связь между факторами должна быть не более 0.7;

- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними;

Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результат фактора xi при неизменном уровне других факторов.

Частные коэффициенты корреляции.

Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.

Теснота связи не сильная

Теснота связи низкая.

Теснота связи не сильная

Теснота связи умеренная

Теснота связи низкая.

Теснота связи умеренная

Уравнение регрессии в стандартизированном масштабе.

Другим видом уравнения множественной регрессии может быть уравнение регрессии в стандартизированном масштабе: ty = β1tx1 + β2tx2.

где

βi – стандартные коэффициенты регрессии.
К уравнению множественной регрессии в стандартизированном масштабе применим МНК. Стандартизированные коэффициенты регрессии (β-коэффициенты) определяются из следующей системы уравнений:

ryx1 = β1 + β2rx2x1

ryx2 = β1rx2x1 + β2

Связь коэффициентов множественной регрессии bi со стандартизированными коэффициентами βi описывается соотношением:

Параметр α определяется как:


α = 5946.72 - 0.21 • 4851.89 - 0.0994 • 593.44 = 4851.75

4. Оценка тесноты связи.

4. Теснота связи результативного признака с факторными определятся величиной коэффициента линейной множественной корреляции и детерминации, который могут быть исчислены на основе матрицы парных коэффициентов корреляции:

Более объективную оценку качества построенной модели дает скорректированный индекс множественной детерминации, учитывающий поправку на число степеней свободы:
где n- число наблюдений, m – число факторов.

Сравнительная оценка влияния анализируемых факторов на результативный признак.

5. Сравнительная оценка влияния анализируемых факторов на результативный признак производится:

- средним коэффициентом эластичности, показывающим на сколько процентов среднем по совокупности изменится результат y от своей средней величины при измени фактора xi на 1% от своего среднего значения;

Частный коэффициент эластичности E1 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности E2 < 1. Следовательно, его влияние на результативный признак Y незначительно.

- β–коэффициенты, показывающие, что, если величина фактора изменится на одно среднеквадратическое отклонение Sxi, то значение результативного признака изменится в среднем на β своего среднеквадратического отклонения;

- долю каждого фактора в общей вариации результативного признака определяют коэффициенты раздельной детерминации (отдельного определения): d2i = ryxiβi.

d21 = 0.82 • 0.000143 = 0.000118.

d22 = 0.78 • 8.6E-5 = 6.7E-5.

При этом должно выполняться равенство:

d21 + d22 = R2yx1x2.

Результаты сравнительного анализа факторов оформляются в таблице:

Проверка гипотезы о статистической значимости уравнения регрессии.

Проверка гипотезы H0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2 = 0) производится по F-критерию Фишера сравнением Fфакт с Fтабл.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.

Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.

2. Далее определяют фактическое значение F-критерия:

где m=2 для множественной регрессии с двумя факторами.

3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 2 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2-1.

4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.

В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.

Табличное значение критерия со степенями свободы k1=2 и k2=15, Fkp = 3.68

Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Частные критерии.

Частные критерии Fx1 и Fx2 оценивают статистическую значимость включения факторов x1 и x2 в уравнение множественной регрессии и целесообразность включения в уравнение одного фактора после другого, т.е. Fx1 оценивает целесообразность включения в уравнение x1 после включения в него фактора x2.

Соответственно Fx2 указывает на целесообразность включения в модель фактора x2 после включения фактора x1.


Поскольку фактическое значение F > Fkp, то коэффициент Fx1 статистически значим, т.е. целесообразно включать в уравнение x1 после включения в него фактора x2.
Поскольку фактическое значение F < Fkp, то коэффициент Fx2 статистически не значим, т.е. не целесообразно включать в уравнение x2 после включения в него фактора x1.
1   2   3


написать администратору сайта