Главная страница

Эконометрика. эконометрика_presentation. Структура курса


Скачать 1.93 Mb.
НазваниеСтруктура курса
АнкорЭконометрика
Дата05.10.2021
Размер1.93 Mb.
Формат файлаppt
Имя файлаэконометрика_presentation.ppt
ТипЛитература
#241656
страница7 из 11
1   2   3   4   5   6   7   8   9   10   11

Тема 9. Ошибки спецификации

Содержание лекции


Невключение в модель существенных переменных
Включение в модель несущественных переменных
Неправильный выбор регрессионной функции


- истинная модель
- оцениваем


оценка смещена

Проблема смещения


Оценка  в короткой регрессии будет завышать или занижать истинное значение коэффициента в зависимости от знака смещения
Оценка будет несмещенной в двух случаях:
 = 0 (Y действительно не зависит от Z);
X и Z статистически независимы.

Иллюстрация смещения


Предположим, что  и  положительны, а X и Z положительно коррелированны, тогда с увеличением X
Y будет иметь тенденцию к росту, поскольку  положителен;
Z будет иметь тенденцию к увеличению, поскольку X и Z положительно коррелированны;
Y получит дополнительное ускорение из-за увеличения Z, поскольку  положительно.
Изменение Y будет преувеличивать влияние текущих значений X, т. к. отчасти они будут связаны с изменениями Z. Т.е. часть изменения Y за счет изменения Z будет приписано X.

Другие последствия


т. е. - смещенная оценка, но обладающая меньшей дисперсией;
оценка s2 смещена. Поскольку s2 участвует во многих статистических тестах, то используя их для проверки гипотез, мы можем получить ложные выводы.


- оцениваем
- истинная модель


точность оценки ухудшается

Последствия включения в модель несущественной переменнй


s2 и оценка  несмещенные
Дисперсия оценки  в «длинной» регрессии больше, чем дисперсия оценки коэффициента при Х в истинной модели, поскольку мы вынуждены по тем же самым наблюдениям оценивать два параметра вместо одного.
Потеря эффективности не случится, если переменные Х и Z некоррелированны. Потеря эффективности приводит к тому, что мы с большей трудностью отвергаем гипотезу о незначимости коэффициента, тем не менее оценка дисперсии  останется несмещенной


- истинная модель
- оцениваем


ситуация является частным случаем ситуации с пропущенными переменными

Вопросы для самопроверки


Какие вы знаете ошибки спецификации.
Каковы последствия невключения в модель существенной переменной.
Каковы последствия включения в модель несущественной перемнной.
Каковы последствия выбора неправильной формы зависимости.
Какой подход к построению модели теоретически более правильный : «снизу вверх» или «сверху вниз»

Тема 10. Процедуры отбора объясняющих переменных

Темы лекций


Две точки зрения на оценку уравнения регрессии, получаемого после отбора наиболее существенных предсказывающих переменных
«Все воэможные регрессии»
Процедура пошагового присоединения переменных

Две точки зрения


Модель регрессии является истинной, тогда при помощи метода наименьших квадратов получается несмещенная и эффективная оценка коэффициентов регрессии. Тогда принудительное приравнивание части коэффициентов к нулю, приводитк смещенным оценкам коэффициентов при оставшихся переменных.
Процесс отбора существенных переменных можно рассматривать как процесс выбора истинной модели из множества возможных линейных моделей, которые могут быть построены с помощью набора объясняющих переменных, и тогда полученные после отбора оценки коэффициентов можно рассматривать как несмещенные (преобладающая).

Если X-ы случайны


Для случая, когда объясняющие переменные – случайные величины, вопрос о правильности (истинности) модели не стоит. Все, что мы ищем в этом случае – модель, сохраняющую ошибку предсказания на разумном уровне при ограниченном количестве переменных.

«Все возможные регрессии»


Проведем р парных регрессий Y на X1,…Xp и выберем ту переменную, для которой коэффициент детерминации наибольший - . на этом шаге мы найдем одну объясняющую переменную, которую можно назвать наиболее информативной объясняющей переменной при условии, что в регрессионную модель мы можем включить только одну из имеющегося набора объясняющих переменных.
Проведем р*(р-1) регрессий, каждый раз включая две из р переменных и выберем ту, которая дает наибольшее значение – пара (X(1), X(2)) – наиболее информативная пара переменных: эта пара будет иметь наиболее тесную статистическую связь с результирующим показателем Y. В состав этой пары переменная из первого шага может и не войти.
Находим три наиболее информативных объясняющих переменных, проведя р*(р-1)*(р-2) регрессий -

Когда остановиться?


Выбираем то k, для которого величина


максимальна

Что плохо?


Очень много регрессий
число регрессий, которые необходимо оценить, большое (равное 2р-2, для p = 20 число возможных переборов будет больше миллиона)


Среди имеющихся р переменных выбираем ту, для которой коэффициент корреляции с объясняемой переменной наибольший.
Теперь мы перебираем не все возможные пары переменных, а лишь те, в которых участвует переменная, полученная на первом шаге. Число переборов в этом случае существенно уменьшится
Среди оставшихся переменных выбираем ту, которая имеет с объясняемой переменной наибольший коэффициент частной корреляции, очищенный от влияния переменной, полученной на первом шаге.

Число переборов


Число переборов -


для р = 20 число переборов будет 209.

Вопросы для самопроверки


Для чего нужны процедуры отбора объясняющих переменных.
Какого взгляда на такие процедуры вы придерживайтесь.
Опишите процедуру «Все возможные регрессии». Каковы ее достоинства и недостатки.
Опишите процедуру пошагового присоединения переменных. Каковы ее достоинства и недостатки.

1   2   3   4   5   6   7   8   9   10   11


написать администратору сайта