эконометрика. Московская финансовопромышленная академия Кафедра Математических методов принятия решений
Скачать 1.01 Mb.
|
Тема 4. Предпосылки метода наименьших квадратов Гетероскедастичность остатков. Автокорреляция остатков. Теорема Гаусса-Маркова. Обобщенный метод наименьших квадратов (ОМНК). Теорема Айткена. Стохастические регрессоры. Метод инструментальных переменных (МИП). Мультиколлинеарность факторов. Задачи изучения темы: научиться выявлять нарушение предпосылок МНК, научиться устранять проявление нарушения предпосылок МНК. Теоретический материал Для того чтобы оценки, полученные по МНК, давали «наилучшие» результаты, мы потребуем от остаточного члена или ошибки и от X выполнения следующих условий. 1. - спецификация модели. Отражает представление о механизме зависимости Y и X и выбор объясняющей переменной X. 2. X1,…,Xk – детерминированные вектора, линейно независимые в Rn, т. е. матрица X имеет ранг k. Линейная независимость нужна для совместности системы нормальных уравнений. В случае зависимости определитель системы мал и вносит большую погрешность. Из детерминированности следует условие, более сильное, что объясняющие переменные не коррелируют со случайной переменной. Во-первых, коррелирует с ?; во-вторых, возможна связь X и Y, т.е. взаимосвязь. Это невозможно, так как регрессии X на Y и Y на X совпадают при функциональной зависимости. 3. . Это обуславливает предположение, что при МНК предполагается, что у зависит только от х: тогда и только тогда, когда . 4. , дисперсия ошибки не зависит от номера наблюдения. Условие независимости ошибок от номера наблюдения называют гомоскедастичностью. Случай, когда условие гомоскедастичности нарушается, называется гетероскедастичностью. Это означает, что в каждом наблюдении неучтенные факторы оказывают одинаковое влияние. 5. при , т. е. некоррелированность ошибок разных наблюдений. Предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Почти всегда нарушается, если данные представляют собой временные ряды. Если это условие не выполняется, говорят об автокорреляции остатков. Отсутствие автокорреляции означает, что все существенные переменные уже учтены в х. Если бы это было бы не так, то y зависел от ?. Если , то - существенный фактор. 6. . Это следует из того, что i включает в себя много факторов, которые можно считать независимыми и нужно для получения интервальных оценок. Теорема Гаусса-Маркова. В условиях 1-5 МНК-оценки представляют собой наилучшие линейные несмещенные оценки. При выполнении условия оценки и регрессия распределены нормально: Автокорреляция остатков. Причины автокорреляции Не учтена важная объясняющая переменная. Неадекватная функция регрессии. Числовой материал содержит большие ошибки наблюдений. Обнаружение автокорреляции остатков производится путем графического анализа остатков и использования критерия Дарбина-Уотсона. Критерий Дарбина-Уотсона. - коэффициент линейной корреляции - отсутствует корреляция - положительная корреляция - отрицательная корреляция Величина d зависит от значений факторов, поэтому однозначно критическое значение найти нельзя. Находят верхнюю и нижнюю границы: Правило: - принимается гипотеза об отсутствии автокорреляции остатков. - принимается гипотеза о наличии положительной автокорреляции остатков. - при выбранном уровне значимости нельзя прийти к определенному выводу. - принимается гипотеза о наличии отрицательной автокорреляции остатков. Гетероскедастичность остатков. Гетероскедастичность остатков означает их неоднородность и количественно выражается в зависимости дисперсии остатков от факторов. Способ обнаружения гетероскедастичности основан на графическом анализе остатков и использовании техники проверки гипотезы о неизменности дисперсии. При этом используются критерии Гольдфельда-Квандта, Уайта, Глейзера идр. Остатки гетероскедастичны, поскольку они зависят от линейной комбинации факторов. Остатки гомоскедастичны, поскольку они не зависят от линейной комбинации факторов. Тест Гольдфельда-Квандта. всю выборку делят на 3 части, оценивают регрессии для крайних выборок, сравнивают оценки дисперсии остатков для полученных регрессий: если эти оценки отличаются незначимо, то делают вывод об отсутствии гетероскедастчности остатков в исходной модели, в противном случае гипотеза об отсутствии гетероскедастичности остатков отклоняется. В случаях обнаружения гетероскедастичности и автокорреляции остатков используется обобщенный метод наименьших квадратов (ОМНК), обоснование которому дает теорема Айткена. Теорема Айткена. Рассматривается обобщенная линейная модель , в которой нет ограничений на отсутствие автокорреляции и гетероскедастичности остатков. В классе несмещенных линейных (по Y) оценок вектора для обобщенной регрессионной линейной модели оценка имеет наименьшую матрицу ковариаций ( - матрица ковариаций остатков). В практических расчетах используется так называемый доступный ОМНК, в котором в качестве матрицы ковариаций выступает ее оценка, полученная после применения обычного МНК. Анализ мультиколлинеарности. Мультиколлинеарность означает зависимость факторов. Ее следует избежать на этапе отбора факторов путем анализа матрицы парных коэффициентов корреляции: , Анализ таблицы ведется с использованием следующих критериев: 1. , , , 2. Стохастические регрессоры. Если факторы являются случайными величинами и коррелируют со случайными возмущениями, то оценки МНК будут смещенными и, возможно, несостоятельными. В этом случае для идентификации модели применяют метод инструментальных переменных. Метод инструментальных переменных. Постановка задачи. Требуется подобрать такие инструментальные переменные (ИП) Z, чтобы они хорошо коррелировали с X и не коррелировали с . Оценкой с помощью ИП называется оценка вида , где . При этом предполагается, что - характеризует хорошую коррелируемость X и Z. . Вопросы для самопроверки В чем состоит суть проблемы предпосылок применения МНК? Каковы предпосылки применения МНК для парной линейной регрессии? Каковы предпосыки применения МНК для множественной линейной регрессии? Что такое гетероскедастичность остатков? Что такое автокорреляция остатков? Что такое мультиколлинеарность факторов? В чем смысл теоремы Гаусса-Маркова? Что такое ОМНК? В чем смысл теоремы Айткена? Что такое стохастические регрессоры? Что такое инструментальные переменные? Каков алгоритм применения МИП? Дополнительная литература Айвазян С.А. Иванова С.С. Эконометрика. Краткий курс: учеб. пособие. – М.: Маркет ДС, 2007. – 104 с. (глава 2, п. 2.2, глава 3, 4, 5, 7). Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: Юнити, 2001. – 430 с. (глава 2, п. 2.4 -2.13). Доугерти К. Введение в эконометрику. – М.: ИНФРА – М, 2009. – 465 с. (Главы 6-8). Елисеева И.И. Эконометрика: Учебник / под. ред. И.И. Елисеевой. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2006. – 344 с. (глава 3, п.3.10 – п.3.11). Интернет-ресурсы http://www.nsu.ru/ef/tsy/ecmr/index.htm http://subscribe.ru/archive/science.humanity.econometrika/200007/17050500.html http://www.statsoft.ru/home/textbook/glossary/default.htm Тема 5. Системы эконометрических уравнений Структурная и приведенная формы модели. Виды систем эконометрических уравнений. Идентификация. Косвенный и двухшаговый метод наименьших квадратов. Задачи изучения: научиться строить модели в виде систем одновременных уравнений, научиться преобразовывать модели из структурной формы в приведенную и наоборот, научиться определять идентифицируемость уравнений модели. Теоретический материал Внешне не связанные уравнения. Связаны только благодаря корреляции остатков. Постановка задачи. , , , , , , , , Последнее означает, что ошибки коррелируют только в одном наблюдении. Каждое уравнение удовлетворяет предпосылкам МНК. Оценка параметров. Можно использовать МНК отдельно для каждого уравнения. Можно улучшить оценки, объединив уравнения и используя связь между уравнениями. , , , , , . Применим ОМНК Оценка МНК Связь с МНК. Оценки ОМНК совпадают с оценками МНК в следующих случаях 1. - отсутствует корреляция остатков – уравнения не связаны. 2. - в каждом уравнении одинаковые наборы экзогенных переменных. Системы одновременных регрессионных уравнений. Постановка задачи. - структурная форма модели , , , , . 1. , 2. , , , . 3. 4. 5. Условие нормировки: один из коэффициентов при Y в каждом уравнении равен единице. - приведенная форма модели. Проблема идентифицируемости модели. Структурная форма. Если выразить Y в каждом уравнении, то экзогенные переменные будут коррелировать с остатками, значит, оценки будут несостоятельными. Приведенная форма. Так как переменные X не коррелируют с остатками, то можно применять ОМНК и получать состоятельные оценки. Проблема: Можно ли использовать оценки приведенной формы для нахождения оценок структурной формы? Структурный коэффициент называется идентифицирумым, если он может быть вычислен на основе коэффициентов приведенной формы. Уравнение в структурной форме модели идентифицируемо, если идентифицируемы все его коэффициенты. Отсутствие идентифицируемости означает, что существует бесконечно много моделей, совместимых с данными, и это никак не связано с числом наблюдений. Не хватает факторов, а не количества наблюдений. Почему коэффициент не может быть вычислен на основе приведенной формы? Пусть в приведенной форме найдено: mk - элементов матрицы П; - элементов . В структурной форме нужно: - элементов B (отнимается число единичных коэффициентов); mk - элементов Г; - элементов . В структурной форме число неизвестных на больше, чем в приведенной форме. Выход видится во введении дополнительных ограничений на коэффициенты структурной формы. Рассмотрим частный случай. Условие идентифицируемости. Необходимо, зная П, определить В и Г. Рассмотрим одно из уравнений системы в структурной форме (для наглядности – первое). Предположим, что в этом уравнении равны нулю последние коэффициентов соответственно при Y и X. Обозначим Тогда Рассмотрим приведенную форму. Выразим коэффициенты структурной формы через известные коэффициенты матрицы П. Для первого уравнения: или Из последнего выражения имеем k-p уравнений с q-1 неизвестным. Необходимое и достаточное условие совместности и определенности системы: - ранговое условие идентифицируемости Матрица является расширенной матрицей неоднородной системы, так как выполняется условие нормировки. Ранговое условие означает, что определитель (q-1)-го порядка этой матрицы не равен нулю, т.е. (q-1) строк линейно независимы и (q-1) столбцов линейно независимы, т.е. определитель матрицы системы также равен (q-1). Здесь важнее условие определенности. Необходимое условие: число уравнений должно быть не меньше числа неизвестных: - порядковое условие идентифицируемости Условие не является достаточным, так как в числе уравнений могут быть зависимые, и тогда ранг матрицы системы может быть меньше числа неизвестных (даже при условии совместности), и имеем множество решений – однозначного решения найти нельзя. Может быть так, что ранг матрицы системы равен рангу расширенной матрицы системы, и число независимых уравнений больше числа неизвестных. При этом порядковое условие выполняется с неравенством – сверхидентифицируемо. Если порядковое условие выполняется с равенством, то уравнение точно идентифицируемо. Рассмотрим пример. Изучается модель вида где – расходы на потребление в период , – совокупный доход в период , – инвестиции в период , – процентная ставка в период , – денежная масса в период , – государственные расходы в период , – расходы на потребление в период , инвестиции в период . Первое уравнение – функция потребления, второе уравнение – функция инвестиций, третье уравнение – функция денежного рынка, четвертое уравнение – тождество дохода. Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию Модель включает четыре эндогенные переменные и четыре предопределенные переменные (две экзогенные переменные – и и две лаговые переменные – и ). Проверим необходимое условие идентификации для каждого из уравнений модели. Первое уравнение: . Это уравнение содержит две эндогенные переменные и и одну предопределенную переменную . Таким образом, , а , т.е. выполняется условие . Уравнение сверхидентифицируемо. Второе уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо. Третье уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо. Четвертое уравнение: . Оно представляет собой тождество, параметры которого известны. Необходимости в идентификации нет. Проверим для каждого уравнения достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели.
В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных модели без одного Первое уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю: . Достаточное условие идентификации для данного уравнения выполняется. Второе уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю: . Достаточное условие идентификации для данного уравнения выполняется. Третье уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю: . Достаточное условие идентификации для данного уравнения выполняется. Таким образом, все уравнения модели сверхидентифицируемы. Приведенная форма модели в общем виде будет выглядеть следующим образом: 1. Оценивание систем одновременных уравнений. Пусть первое (для определенности) уравнение идентифицируемо. Косвенный МНК. 2. 3. Алгоритм: МНК . По теореме Слуцкого оценки являются состоятельными, так как они являются непрерывными функциями состоятельных оценок. Двухшаговый МНК. 4. 5. , , , , . 6. , 7. , , , . 8. 9. 10. Условие нормировки: один из коэффициентов при Y в каждом уравнении равен единице. Пусть в 1-м уравнении равны нулю последние коэффициентов при Y и X. Выразим из этого уравнения одну переменную: Столбцы коррелируют с , так как в другом уравнении выразится через , а, значит, через . Поэтому оценки МНК не будут состоятельными. Идея двухшагового МНК: использование X, не входящих в в качестве ИП для . Метод является способом выбора ИП. Условие идентифицируемости позволяет использовать n-p ИП для q-1 переменных (условие применения ИП: m>p – число ИП должно быть не меньше числа заменяемых переменных). Если брать только из X, входящих в , то будет полная коллинеарность. Алгоритм: Регрессия - на все экзогенные переменные. Регрессия , где Замечания: Если , , то оценка косвенного МНК совпадает с оценкой двухшагового метода. Оценка двухшагового МНК совпадает с оценкой ИП, если в качестве ИП берут . Если в качестве ИП для выбирать любые линейные комбинации из X, то матрица ковариаций оценки будет не меньше матрицы ковариаций двухшагового МНК, т.е. он дает оценку, эффективную в некотором классе оценок. Фактически оценивается каждое уравнение. Взаимодействие уравнений учитывается путем применения трехшагового МНК. Вопросы для самопроверки Что такое структурная форма системы эконометрических уравнений? Что такое приведенная форма системы эконометрических уравнений? В чем состоит проблема идентифицируемости системы эконометрических уравнений? Критерии идентифицируемости системы эконометрических уравнений? Каковы методы идентификации системы эконометрических уравнений? Каков алгоритм косвенного МНК? Каков алгоритм двухшагового МНК? Дополнительная литература Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: Юнити, 2001. – 430 с. (глава 4). Доугерти К. Введение в эконометрику. – М.: ИНФРА – М, 2009. – 465 с. (Глава 9). Елисеева И.И. Эконометрика: Учебник / под. ред. И.И. Елисеевой. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2006. – 344 с. (глава 5). Интернет-ресурсы http://www.nsu.ru/ef/tsy/ecmr/index.htm http://subscribe.ru/archive/science.humanity.econometrika/200007/17050500.html http://www.statsoft.ru/home/textbook/glossary/default.htm |