СТАТИСТИКА. статистика. Построим поле корреляции и расчётную таблицу
Скачать 25.04 Kb.
|
Построим поле корреляции и расчётную таблицу.
Для наших данных система уравнений имеет вид 12a + 362·b = 549 362·a + 11384·b = 16006 Домножим уравнение системы на (-30.167), получим систему, которую решим методом алгебраического сложения. -362a -10920.454 b = -16561.683 362*a + 11384*b = 16006 Получаем: 463.546*b = -555.683 Откуда b = -1.1981 Теперь найдем коэффициент «a» из уравнения (1): 12a + 362*b = 549 12a + 362*(-1.1981) = 549 12a = 982.697 a = 81.8914 Получаем эмпирические коэффициенты регрессии: b = -1.1981, a = 81.8914 Уравнение регрессии (эмпирическое уравнение регрессии): y = -1.1981 x + 81.8914 Выборочные средние = 362/12 = 30.167 = 549/12 = 45.75 = 1333.833 S2(x) = (11384/12) – (30.167)2 = 38.64 S2(y) = (28397/12) – (45.75)2 = 273.35 S(x) = = 6.216 S(y) = = 16.533 Коэффициент корреляции Rxy = = - 0.45 Связь между y и x обратная и умеренная Tнабл = 0.45 * = 1.595 Tкрит (10;0.025) = 2.634 |Tнабл | Tкрит , то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим. (r – tкрит * ; r + tкрит * ) R (-1; 0.293) E = -1.198 * = -0.79 Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно. Ошибка аппоксимации = * 100% = 33.23 % В среднем, расчетные значения отклоняются от фактических на 33.23%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии. Коэффициент детерминации R2= -0.452 = 0.2029 т.е. в 20.29% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 79.71% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации) Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05. H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности; H1: b ≠ 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. Tb = -1.198/0.751 = 1.6 < 2.634, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь. Ta = 81.891/23/13 = 3.54 > 2.634, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b - tкрит Sb; b + tкрит Sb) (-1.2 - 2.634*0.751; -1.2 + 2.634*0.751) (-3.176;0.78) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a - tкрит Sa; a + tкрит Sa) (81.891 - 2.634*23.13; 81.891 + 2.634*23.13) (20.968;142.815) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. F = * = 2.545 Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96 Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна) Xp = 30.167 * 105% = 31.68 В исследуемой ситуации 20.29% общей вариабельности у объясняется критерием х. Параметры модели статистически не значимы. Увеличение доли гос. Сектора в общей численности занятых на малых предприятиях на 1% приводит к увеличению среднемесячной зп на 1 тыс. рублей. 2. Проверим необходимое условие идентификации для уравнений модели. Модель включает K=3 эндогенные переменные (y1, y2, y3) и M=3 предопределенные (экзогенные) переменные (e1, x1, x2). K-1 = 2; K + M = 6 Приведенная форма модели. y1=A11e1+A12 x1+A13 x2+U1 y2=A21e1+A22 x1+A23 x2+U2 y3=A31e1+A32 x1+A33 x2+U3 Уравнение №1. y1=a1+b12*y2+e1 Это уравнение включает 2 эндогенные переменные (y1, y2), т.е. k1 = 2 и 1 предопределенную переменную (e1), т.е. m1 = 1. M-m1 = 2 > k1 - 1 = 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации). Уравнение №2. y2=a2+b21*y1+c21*x1+e1 Это уравнение включает 2 эндогенные переменные (y1, y2), т.е. k2 = 2 и 2 предопределенных переменных (e1, x1), т.е. m2 = 2. M-m2 = 1 = k2 - 1 = 1, то уравнение точно идентифицируемо (при выполнении достаточных условий идентификации). Уравнение №3. y3=a3+b31*y1+c32*x2+e_3 Это уравнение включает 2 эндогенные переменные (y1, y3), т.е. k3 = 2 и 1 предопределенную переменную (x2), т.е. m3 = 1. M-m3 = 2 > k3 - 1 = 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации). Матрица коэффициентов при переменных модели.
Уравнение №1. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:
Ее ранг равен 2, следовательно, detA ≠ 0. Достаточное условие идентификации для уравнения №1 выполняется. Уравнение №2. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:
Так как определитель этой матрицы detA = -1* - c32* = 0, то ее ранг равен 1. Достаточное условие идентификации для уравнения №2 не выполняется. Уравнение №3. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:
Ее ранг равен 2, следовательно, detA ≠ 0. Достаточное условие идентификации для уравнения №3 выполняется. Сделаем выводы: Уравнение №1 сверхидентифицируемо, уравнение №3 сверхидентифицируемо. Для оценки параметров 1-ого уравнения можно применить двухшаговый МНК. Параметры 2-ого уравнения определить по коэффициентам приведенной формы нельзя. Поэтому модель должна быть модифицирована. Для оценки параметров 3-ого уравнения можно применить двухшаговый МНК. |