парная регрессия. 1-парная регрессия. Парная регрессия типы переменных в эконометрической модели
Скачать 432.71 Kb.
|
ПАРНАЯ РЕГРЕССИЯТипы переменных в эконометрической модели
Регрессионный анализПредназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме модели.
Предпосылки применения метода наименьших квадратов (МНК)Первое условие. Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю Второе условие состоит в том, что возмущение (или зависимая переменная ) есть величина случайная. Третье условие предполагает отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях Четвертое условие означает, что дисперсия случайной составляющей должна быть постоянна для всех наблюдений. Это условие гомоскедастичности. Предположение о нормальности Наряду с перечисленными условиями Гаусса— Маркова обычно также предполагается нормальность распределения случайного члена. Свойства оценок метода наименьших квадратов (МНК) Оценки параметров регрессии должны быть несмещенными, состоятельными и эффективными
Линейная парная регрессияyi = a0 + a1 · xi + ε i ,где a0 – постоянная величина,a1 – коэффициент регрессии, характеризует угол наклона линии регрессии.Если a1 > 0, то переменные x и y положительно коррелированы, если a1 < 0 – отрицательно.a0 + a1 · xi - неслучайная составляющая;ε i – случайная составляющая с нулевым математическим ожиданием и постоянной дисперсией, она учитывает неучтенные факторы, ошибки измерения и пр.Матричная форма оценки параметров уравнения регрессии МНКY = X · A + ε ,где Y – вектор-столбец (nx1) наблюдаемых значений зависимой переменной;X – матрица (nx2) значений факторов;A – вектор-столбец (2x1) неизвестных коэффициентов регрессии;ε – вектор-столбец (nx1) ошибок наблюдений
в матричном виде: A = (X’·X)-1·X’·Y .Для расчетавектора A необходимо:Метод наименьших квадратовОценка параметров уравнения регрессии МНКМНК минимизирует сумму квадратов отклонения фактических значений yi от расчетныхa1= = ==__ __a0 = y – a1 · x .yp = a0 + a1· xОценка качества модели регрессииКачество модели оценивается на основе анализа остаточной компоненты (εi = yi – yр ):Качество модели регрессии оценивается по следующим направлениям:
дисперсия объясненная необъясненнаяРазделив обе части уравнения на левую получим:Коэффициент детерминации R2Откуда, в окончательном виде имеем :Коэффициент детерминации показывает долю вариации результативного признака, находяще-гося под воздействием изучаемых факторов.Чем ближе R2 к 1, тем выше качество модели.Если R2 =0 ? – связь между признаками отсутствует Если R2 = 1 ? - связь функциональнаяКоэффициент множественной корреляции RR = =Он отражает и тесноту связи и точность моделиОсновные свойства коэффициента детерминации 1. 0 < R2 < 1. 2. Чем ближе R2 к 1, тем лучше регрессия аппроксимирует статистические данные, тем теснее линейная связь между зависимой и объясняющими переменными. 3. Если R2 = 1, то статистические данные лежат на линии регрессии, т.е. между зависимой и объясняющими переменными имеется функциональная зависимость. Если R2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных. 4. В случае парной регрессии R2 = r 2. Критерий Фишера используется для проверки значимости модели регрессии при выбранном уровне α и степенях свободы k1 и k2. Для однофакторной модели регрессии:Критерии точности моделиСредняя квадратическая ошибка –(стандартная ошибка оценки)- для однофакторной моделиСредняя относительная ошибка аппроксимации:AЕсли A ≤ 7%, то модель имеет хорошее качество.Проверка гипотез о значимости параметров уравнения регрессии.Выдвигается H0 – гипотеза о незначимом отличии параметра уравнения регрессии от нуля.Для проверки этой гипотезы используется t – статистика (имеющая распределение Стьюдента).Показатели качества коэффициентов регрессии
2. Значения t-статистик (проверка гипотез относительно коэффициентов регрессии). 3. Интервальные оценки коэффициентов линейного уравнения регрессии. 4. Доверительные области для зависимой переменной. Стандартные ошибки оценок Оценки b0 и b1 являются случайными величинами. Отсюда следует, что стандартные ошибки коэффициентов регрессии - это средние квадратические отклонения коэффициентов регрессии от их истинных значений. 2 Свойства дисперсий оценок 1. Дисперсии D[b0] и D[b1] прямо пропорциональны дисперсии случайного отклонения Следовательно, чем больше фактор случайности, тем менее точными будут оценки. 2. Чем больше число наблюдений n, тем меньше дисперсии оценок. 3. Чем больше дисперсия объясняющей переменной, тем меньше дисперсия оценок коэффициентов регрессии. Другими словами, чем шире область изменений объясняющей переменной, тем точнее будут оценки (тем меньше доля случайности в их определении). Стандартная ошибка является оценкой среднего квадратического отклонения коэффициента регрессии от его истинного значения Использование стандартных ошибок Сравнивая значение коэффициента с его стандартной ошибкой, можно судить о значимости коэффициента Коэффициент называется значимым, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля Для стандартных ошибок оценок нет таблиц критическихуровней — для точного суждения используются t-статистики Типичные ошибки в использовании показателей качества регрессии - Величина коэффициентов регрессии не указывает на силу связи или силу влияния на зависимую переменную - Значимость коэффициентов по t-тестам не позволяет сделать вывод о справедливости тех или иных теорий - t-статистики не указывают на относительную важность коэффициентов регрессии - t-статистики предназначены для использования исключительно для выборки и бесполезны для анализа всей совокупности - Нельзя сравнивать t-статистики, F-статистики, коэффициенты детерминации и др. у разных уравнений tb0 = |b0| / Sb0 и ta1 = |b1| / Sb1 ,где Sb0Sb1Здесь tа0 или tа1>tтабл , то параметр значим[В Excel tтабл => СТЬЮДРАСПОБР]выполняется для значимого уравнения по формулам:a0 =[a0 ± tтабл·Sa0 ] – для свободного члена a0 ;a1 = [a1 ± tтабл·Sa1 ] – для параметра a1 .где tтабл – критерий Стьюдента для k =n-2 степеней,Sa0 ,Sa1 – стандартные отклоненияПрогнозирование по уравнению регрессииТочечный прогноз получают подстановкой ожидаемого значения xпрогн в уравнение: yпрогн=a0+ a1·xпрогнПоскольку вероятность точечного прогноза близка к нулю, то рассчитывается доверительный интервал, в который с вероятностью (1-α ) попадут прогнозные значения y прогн.Средняя ошибка прогноза Точечный прогноз ± Интервальный прогноз = Графическая интерпретация результатов расчетаyНижняя доверительная граница Верхняя доверительная граница Линия регрессии Доверительный интервал x Администрация страховой компании приняла решение о введении нового вида услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции. Задача
Прогноз по модели Y=10,25+4,69XПрогноз ХПо исходным данным полагают, что расстояние до ближайшей пожарной станции уменьшится на 5% от своего среднего уровняПрогноз Y Стандартная ошибка 1.801 Строим доверительный интервал прогноза ущерба с вероятностью 0,90 (t=1,86). Из полученных результатов видно, что интервал от 20,67 до 27,7 тыс. руб. ожидаемой величины ущерба довольно широкий. Значительная неопределенность прогноза линии регрессии, связана, прежде всего с малым объемом выборки (n=10), а также тем, что по мере удаления прогнозного знаения Х от среднего ширина доверительного интервала увеличивается. Стандартная ошибка 1.801 График прогнозаПризнаки качественной модели 1. Простота модели (из примерно одинаково отражающих реальность моделей, выбирается та, которая содержит меньше объясняющих переменных. 2. Единственность (для любых данных коэффициенты модели должны вычисляться однозначно). 3. Максимальное соответствие (модель тем лучше, чем больше скорректированный коэффициент детерминации). 4. Согласованность с теорией (уравнение регрессии должно соответствовать теоретическим предпосылкам). 5. Прогнозные качества (прогнозы, полученные на основе модели, должны подтверждаться реальностью). |