Приложение 1_Эконометрика. Оценочные материалы текущего контроля успеваемости. Методические материалы по проведению процедур оценивания
Скачать 4.57 Mb.
|
Значения параметров регрессии и составляют: Тогда . Индекс корреляции: . Следовательно, связь умеренная. Ошибка аппроксимации для всех функций повышенная: а) , б) , в) , г) ; но в допустимых пределах. F-критерий Фишера: а) поскольку , следует рассмотреть ; . Что говорит о принятии гипотезы о статистической не значимости параметров уравнения и показателя тесноты связи и случайной природе выявленной зависимости. б) гипотеза принимается. в) гипотеза принимается. г) гипотеза принимается, т.к. . Пример 2. По 12 территориям региона вводятся данные (таблица 6). Таблица 6
Требования: Постройте линейное уравнение парной регрессии у от х. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. Оценить статистическую значимость параметров регрессии и корреляции. Выполнить прогноз у при прогнозном значение х, составляющем 107% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. Решение: Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 7. Таблица 7
Тогда параметры регрессии: Уравнение регрессии: , т.е. с увеличением х на 1ед. у возрастает в среднем на 0,89ед. Тесноту линейной связи оценит коэффициент корреляции: Это означает, что 51% вариации у объясняется вариацией фактора х. Качество модели определяет средняя ошибка аппроксимации: . Качество построенной модели оценивается как хорошее, т.к. не превышает 8-10%. Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Выдвигаем гипотезу о статистически не значимом отличии показателей от нуля: . для числа степеней свободы и составит 2,23. Определим случайные ошибки : Тогда -статистики Стьюдента: ; Фактические значения -статистики превосходят табличные значения: Поэтому гипотеза отклоняется, т.е. и не случайно отличаются от нуля, а статистически значимы. Рассчитаем доверительный интервал для и . Для этого определим предельную ошибку для каждого показателя: Доверительные интервалы: Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля. Полученные оценки уравнения регрессии позволяют использовать для прогноза. Если прогнозное значение х составит: ед.; тогда прогнозное значение у составит: ед. Ошибка прогноза составит: Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит: . Доверительный интервал прогноза: Выполненный прогноз у оказался надежным ( ), но не точным, т.к. диапазон верхней и нижней границ доверительного интервала составляет 1,45 раза: . Пример 3. По 30 территориям России имеются данные, представленные в таблице 8: Таблица 8
Требуется: Построить уравнение множественной регрессии в стандартной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с и , пояснить различия между ними. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними. Рассчитать общий и частные - критерии Фишера. Решение: Линейное уравнение множественной регрессии у от х1 и х2 имеет вид:. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизированном масштабе: Расчет -коэффициентов выполним по формулам: ; ; Получим уравнение: . Для построения уравнения в естественной форме рассчитаем и , используя формулы для перехода от к : ; ; . Значение а определим из соотношения: . Для характеристики относительной силы влияния х1 и х2 на у рассчитаем средние коэффициенты эластичности: ; ; . С увеличением средней заработной платы х1 на 1% от ее среднего уровня средний душевой доход у возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного х2 на 1% среднедушевой доход у снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния, средней заработной платы х1 на средний душевой доход у оказалась большей, чем сила влияния среднего возраста безработного х2. К аналогичным выводам о силе связи приходим при сравнении модулей значений и : . Различия в силе влияния фактора на результат, полученные при сравнении и , объясняются тем, что коэффициент эластичности исходит из соотношения средних: ; а коэффициент - из соотношения средних квадратических отклонений: . 2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле: Если сравнить значения парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи ( ) коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: ; ; ; ; ; . Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и : . Зависимость у от х1 и х2 характеризуются как тесная, в которой 72% вариации среднего душевного дохода определяется вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28% от общей вариации у. 3. Общий F-критерий проверяет гипотезу Н0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2=0): ; Fтабл=3,4; при . Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу Н0, т.к. Fтабл=3,4<Fфактл=34,6. С вероятностью 1- делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи , которые сформировались под неслучайным воздействием факторов х1 и х2. Частные F-критерии - и оценивают статистическую значимость присутствия факторов х1 и х2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора х1 после того, как в него был включен фактор х2. Соответственно указывает на целесообразность включения в модель фактора х2 после фактора х1: ; при . Сравним Fтабл и Fфакт приходим к выводу о целесообразности включения в модель фактора х1 после фактора х2, т.к. гипотезу Н0 о не существенности прироста за счет включения дополнительного фактора х1 отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора х1 после фактора х2. Целесообразность включения в модель фактора х2 после фактора х1 проверяет : Низкое значение (немногим >1) свидетельствует о статистической не значимости прироста за счет включения в модель фактора х2 после фактора х1. Таким образом подтверждается нулевая гипотеза Н0 о нецелесообразности включения в модель фактора х2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надежной и что нет необходимости улучшать ее, включая дополнительный фактор х2 (средний возрасте безработного). Пример 4. Имеются данные (таблица 9) за 5лет: Таблица 9
|