Главная страница

СТАТИСТИКА. статистика. Построим поле корреляции и расчётную таблицу


Скачать 25.04 Kb.
НазваниеПостроим поле корреляции и расчётную таблицу
АнкорСТАТИСТИКА
Дата15.04.2022
Размер25.04 Kb.
Формат файлаdocx
Имя файластатистика.docx
ТипДокументы
#476644

Построим поле корреляции и расчётную таблицу.

x

y

X2

Y2

x*y

y(x)

(yi-ycp)2

(yi-y(x))2

(xi-xcp)2

|yi-yx|:y

25

23

625

529

575

51,93997

517,5625

837,5219

26,69444

1,25826

29

38

841

1444

1102

47,14774

60,0625

83,68106

1,361111

0,24073

35

24

1225

576

840

39,95938

473,0625

254,7019

23,36111

0,664974

29

44

841

1936

1276

47,14774

3,0625

9,908238

1,361111

0,071539

40

52

1600

2704

2080

33,96909

39,0625

325,1138

96,69444

0,346748

17

85

289

7225

1445

61,52444

1540,563

551,1018

173,3611

0,276183

37

29

1369

841

1073

37,56326

280,5625

73,32949

46,69444

0,295285

38

48

1444

2304

1824

36,3652

5,0625

135,3685

61,36111

0,242392

26

42

676

1764

1092

50,74191

14,0625

76,42103

17,36111

0,208141

31

52

961

2704

1612

44,75162

39,0625

52,53905

0,694444

0,139392

27

49

729

2401

1323

49,54385

10,5625

0,295776

10,02778

0,011099

28

63

784

3969

1764

48,34579

297,5625

214,7457

4,694444

0,232606

362

549

11384

28397

16006

549

3280,25

2614,728

463,6667

3,987349



Для наших данных система уравнений имеет вид

12a + 362·b = 549

362·a + 11384·b = 16006

Домножим уравнение системы на (-30.167), получим систему, которую решим методом алгебраического сложения.

-362a -10920.454 b = -16561.683

362*a + 11384*b = 16006

Получаем:

463.546*b = -555.683

Откуда b = -1.1981

Теперь найдем коэффициент «a» из уравнения (1):

12a + 362*b = 549

12a + 362*(-1.1981) = 549

12a = 982.697

a = 81.8914

Получаем эмпирические коэффициенты регрессии: b = -1.1981, a = 81.8914

Уравнение регрессии (эмпирическое уравнение регрессии):

y = -1.1981 x + 81.8914

Выборочные средние

= 362/12 = 30.167

= 549/12 = 45.75

= 1333.833

S2(x) = (11384/12) – (30.167)2 = 38.64

S2(y) = (28397/12) – (45.75)2 = 273.35

S(x) = = 6.216

S(y) = = 16.533

Коэффициент корреляции

Rxy = = - 0.45

Связь между y и x обратная и умеренная

Tнабл = 0.45 * = 1.595

Tкрит (10;0.025) = 2.634

|Tнабл | Tкрит , то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим.

(r – tкрит * ; r + tкрит * )

R (-1; 0.293)

E = -1.198 * = -0.79

Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.

Ошибка аппоксимации

= * 100% = 33.23 %

В среднем, расчетные значения отклоняются от фактических на 33.23%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.

Коэффициент детерминации

R2= -0.452 = 0.2029

т.е. в 20.29% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 79.71% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации)

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ≠ 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

Tb = -1.198/0.751 = 1.6 < 2.634, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

Ta = 81.891/23/13 = 3.54 > 2.634, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:

(b - tкрит Sb; b + tкрит Sb)

(-1.2 - 2.634*0.751; -1.2 + 2.634*0.751)

(-3.176;0.78)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

(a - tкрит Sa; a + tкрит Sa)

(81.891 - 2.634*23.13; 81.891 + 2.634*23.13)

(20.968;142.815)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

F = * = 2.545

Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96

Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна)

Xp = 30.167 * 105% = 31.68

В исследуемой ситуации 20.29% общей вариабельности у объясняется критерием х. Параметры модели статистически не значимы.

Увеличение доли гос. Сектора в общей численности занятых на малых предприятиях на 1% приводит к увеличению среднемесячной зп на 1 тыс. рублей.

2.

Проверим необходимое условие идентификации для уравнений модели.
Модель включает K=3 эндогенные переменные (y1, y2, y3) и M=3 предопределенные (экзогенные) переменные (e1, x1, x2).
K-1 = 2; K + M = 6
Приведенная форма модели.
y1=A11e1+A12 x1+A13 x2+U1
y2=A21e1+A22 x1+A23 x2+U2
y3=A31e1+A32 x1+A33 x2+U3
Уравнение №1.
y1=a1+b12*y2+e1
Это уравнение включает 2 эндогенные переменные (y1, y2), т.е. k1 = 2 и 1 предопределенную переменную (e1), т.е. m1 = 1.
M-m1 = 2 > k1 - 1 = 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации).
Уравнение №2.
y2=a2+b21*y1+c21*x1+e1
Это уравнение включает 2 эндогенные переменные (y1, y2), т.е. k2 = 2 и 2 предопределенных переменных (e1, x1), т.е. m2 = 2.
M-m2 = 1 = k2 - 1 = 1, то уравнение точно идентифицируемо (при выполнении достаточных условий идентификации).
Уравнение №3.
y3=a3+b31*y1+c32*x2+e_3
Это уравнение включает 2 эндогенные переменные (y1, y3), т.е. k3 = 2 и 1 предопределенную переменную (x2), т.е. m3 = 1.
M-m3 = 2 > k3 - 1 = 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации).
Матрица коэффициентов при переменных модели.




y1

y2

y3

e1

x1

x2

Уравнение №1

-1

b12

0

1

0

0

Уравнение №2

b21

-1

0

1

c21

0

Уравнение №3

b31

0

-1

0

0

c32

Уравнение №1.
Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:

0

c21

0

-1

0

c32










Ее ранг равен 2, следовательно, detA ≠ 0.
Достаточное условие идентификации для уравнения №1 выполняется.
Уравнение №2.
Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:

0

0

-1

c32










Так как определитель этой матрицы detA = -1* - c32* = 0, то ее ранг равен 1.
Достаточное условие идентификации для уравнения №2 не выполняется.
Уравнение №3.
Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:

b12

1

0

-1

1

c21










Ее ранг равен 2, следовательно, detA ≠ 0.
Достаточное условие идентификации для уравнения №3 выполняется.
Сделаем выводы:
Уравнение №1 сверхидентифицируемо, уравнение №3 сверхидентифицируемо. Для оценки параметров 1-ого уравнения можно применить двухшаговый МНК. Параметры 2-ого уравнения определить по коэффициентам приведенной формы нельзя. Поэтому модель должна быть модифицирована. Для оценки параметров 3-ого уравнения можно применить двухшаговый МНК.



написать администратору сайта