эконометрика. Линейные, нелинейные и множественные регрессии студент II курса
Скачать 120.87 Kb.
|
F-статистика. Критерий Фишера. = или по формуле: = где Табличное значение критерия со степенями свободы k1=1 и k2=18, Fтабл = 4.41 Поскольку фактическое значение F> Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна). t-статистика. Критерий Стьюдента. tкрит (n-m-1; α/2) = (18;0.025) = 2.101 Поскольку 8.59> 2.101, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Поскольку 4.72> 2.101, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b - tкрит Sb; b + tкрит Sb) (0.98 - 2.101*0.115; 0.98 + 2.101*0.115) (0.743;1.224) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a - tкрит Sa; a + tкрит Sa) (-40.519 - 2.101*8.592; -40.519 + 2.101*8.592) (-58.572; -22.467) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством: 4. Выполнить прогноз производство продукции при прогнозномСреднегодовая стоимость основных производственных фондов, составляющем 55 млн. y = bx + a y = 0.9834 x -40.5191 при y = 55 x = 55 + 40.5191/ 0.9834 x = 97.13 Производство продукции при прогнозной среднегодовой стоимости основных производственных фондов в 55 млн. лей составит 97.13 млн. лей. 5. Оценить точность прогноза, рассчитав ошибку прогноза и егодоверительный интервал. p=90% Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Хр = 90 tкрит (n-m-1; α/2) = (18;0.025) = 2.101 y (90) = 0.983*90 -40.519 = 47.991 Вычислим ошибку прогноза для уравнения y = bx + a = или = 47.991 ± 4.481 (43.51;52.47) С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. 7. Тест на гетероскедастичность –Графическийанализ. Tест Гельфельда-Квандта, p=99% При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
Проверка наличия гетероскедастичности. 1) Методом графического анализа остатков. В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения ei, либо их квадраты e2i. Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности. Тест Гельфельда-Квандта. В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению xi переменной X в этом наблюдении, т.е. σ2i = σ2x2i, i = 1, 2…, n. Тест Гельфельда-Квандта состоит в следующем: 1. Все n наблюдений упорядочиваются по величине X. 2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k, (n-2k),k. 3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений). 4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика: F = S3/S1 Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = (n – c - 2m)/2. 5. Если F> Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется. Этот же тест может использоваться при предположении об обратной пропорциональности между σi и значениями объясняющей переменной. При этом статистика Фишера имеет вид: F = S1/S3 1. Упорядочим все значения по величине X. 2. Находим размер подвыборки k = (20 - 5)/2 = 8. где c = 4n/15 = 4*20/15 = 5 3. Оценим регрессию для первой подвыборки. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑x = ∑y a0∑x + a1∑x2 = ∑y•x Для наших данных система уравнений имеет вид: 8a0 + 515a1 = 191 515a0 + 33357a1 = 12419 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 0.61, a1 = -15.08
Здесь S1 = 108.21 Оценим регрессию для третьей подвыборки. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑x = ∑y a0∑x + a1∑x2 = ∑y•x Для наших данных система уравнений имеет вид: 8a0 + 677a1 = 357 677a0 + 57445a1 = 30347 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 0.88, a1 = -30.1
Здесь S3 = 119.89 Число степеней свободы v1 = v2 = (n – c - 2m)/2 = (20 - 5 - 2*1)/2 = 6.5 Fkp (6.5,6.5) = 5.59 Строим F-статистику: F = 119.89/108.21 = 1.11 Поскольку F 8.Автокорреляция 1-го порядка и критерий Дарбина-Уотсона. α = 0,05 = Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки. Стандартная ошибка коэффициента корреляции рассчитывается по формуле: Коэффициенты автокорреляции случайных данных должны обладать выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным Если коэффициент автокорреляции первого порядка r1 находится в интервале: -2.101 • 0.224 < r1 < 2.101 • 0.224 то можно считать, что данные не показывают наличие автокорреляции первого порядка. Используя расчетную таблицу, получаем: = Так как -0.47 < r1 = 0.128 < 0.47, то свойство независимости остатков выполняется. Автокорреляции отсутствует. |