Эконометрика-Практикум-Елисеева. Практикум по эконометрике под редакцией членакорреспондента Российской Академии наук И. И. Елисеевой
Скачать 4.16 Mb.
|
РАЗДЕЛ I ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ1.1. МЕТОДИЧЕСКИЕ УКАЗАНИЯПарная регрессия - уравнение связи двух переменных y и х: y= (x), где у - зависимая переменная (результативный признак); х - независимая, объясняющая переменная (признак-фактор). Различают линейные и нелинейные регрессии. Линейная регрессия: y = а + b х + . Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам. Регрессии, нелинейные по объясняющим переменным: • полиномы разных степеней у = а + b1 х + b2 х2 + b3 x3 + ; • равносторонняя гипербола у = а + + . Регрессии, нелинейные по оцениваемым параметрам: • степенная у = а хb ; • показательная у = a bx; • экспоненциальная у = еa+bx Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е. min. Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно а и b: . Можно воспользоваться готовыми формулами, которые вытекают из этой системы: , . Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии (–1 1): , и индекс корреляции - для нелинейной регрессии (0 1): . Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических: . Допустимый предел значений А - не более 8-10%. Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения: . Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной: , где - общая сумма квадратов отклонений; - сумма квадратов отклонений, обусловленная регрессией (“объясненная” или “факторная”); - остаточная сумма квадратов отклонений. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2: . Коэффициент детерминации - квадрат коэффициента или индекса корреляции. F-mecm - оценивание качества уравнения регрессии - состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы: Fфакт = , где п - число единиц совокупности; т - число параметров при переменных х. Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно принимается равной 0,05 или 0,01. Если Fтабл < Fфакт, то H0- гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза H0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза H0о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки: ; ; . Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам: ; ; . Сравнивая фактическое и критическое (табличное) значения t-статистики - tтабл и tфакт - принимаем или отвергаем гипотезу H0. Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством . Если tтабл < tфакт, то H0 отклоняется, т.е. а, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт, то гипотеза H0 не отклоняется и признается случайная природа формирования а, b или . Для расчета доверительного интервала определяем предельную ошибку для каждого показателя: a = tтаблma, b = tтаблmb. Формулы для расчета доверительных интервалов имеют следующий вид: a = a a; ; . b = b b; ; . Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения. Прогнозное значение yp определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения xр. Вычисляется средняя стандартная ошибка прогноза : , где ; и строится доверительный интервал прогноза: ; ; , где = tтабл . |