Эконометрика. эконометрика_presentation. Структура курса
Скачать 1.93 Mb.
|
Тема 2. Парная линейная регрессионная модельПЛРМ Две переменные X и Yмогут быть связаны функциональной зависимостью (т.е. существует функция f что Y = f(X), значения переменной Y полностью определяются значениями переменной X) статистической зависимостью независимы. Статистическая зависимостьЕсли при изменении X меняется закон распределения случайной величины Y, то говорят, что величины (X,Y) связаны статистической зависимостью. Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Корреляционная зависимостьЕсли каждому значению величины X соответствует свое значение то говорят, что существует регрессионная функция Случайная составляющаяОтклонение переменной Y от математического ожидания для соответствующего значения переменной X называется ошибкой и обозначается Регрессионное уравнениеУравнение называется уравнением регрессии переменной Y на переменную X Экономический смысл невключение объясняющих переменных в уравнение. На самом деле на переменную Y влияет не только переменная X, но и ряд других переменных, которые не учтены в нашей модели по следующим причинам:
существуют факторы, которые мы знаем, как измерить, но влияние их на Y так слабо, что их не стоит учитывать; существенные переменные, но из-за отсутствия опыта или знаний мы их таковыми не считаем. Экономический смысл (продолжение)Неправильная функциональная спецификация. Функциональное соотношение между Y и Х может быть определено неправильно. Например, мы предположили линейную зависимость, а она может быть более сложной. Ошибки наблюдений (занижение реального уровня доходов). В этом случае наблюдаемые значения не будут соответствовать точному соотношению, и существующее расхождение будет вносить свой вклад в остаточный член. Способы определения регрессионной функции f(X)параметрический – предполагаем, что вид регрессионной функции известен, неизвестны параметры функции непараметрический – предполагаем, что вид регрессионной функции неизвестен и мы составляем алгоритм расчета значений функции в каждой точке Выбор вида f(X)экономическая теория опыт, интуиция исследователя эмпирический анализ данных Эмпирический анализ данныхВ парном случае материал наблюдений представляет собой набор пар чисел: . На плоскости каждому такому наблюдению соответствует точка: Полученный график называют облако наблюдений, поле корреляции или диаграмма рассеяния. По виду облака наблюдений можно определить вид регрессионной функции. Линейная Y=+X+.КвадратичнаяПоказательнаяСтепеннаяГиперболическаяX и Y независимыПарная линейная регрессионная модель Y=+X+.Выбор коэффициентов регрессионной прямойИз всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных. Рассмотрение остатков на графикеИнтегральная мера близостиМетод наименьших квадратовСреди всех возможных прямых выбираем ту, для которой сумма квадратов остатков минимальна Минимизацияили Система нормальных уравненийМНК-коэффициенты ПЛРМ- коэффициент наклона - свободный коэффициент Другие формы записи коэффициента наклонаЗамечанияЛиния регрессии проходит через точку Мы предполагаем, что среди Xi есть разные, тогда X 0. В противном случае, оценок по методу наименьших квадратов не существует. Теснота линейной корреляционной связиВ качестве меры близости данных наблюдений к линии регрессии служит выборочный коэффициент парной линейной корреляции (парный линейный коэффициент корреляции): Связь между коэффициентом корреляции и коэффициентом наклонаЗнак коэффициента наклона линии регрессии и коэффициента корреляции совпадают Если - необходимое и достаточное условием того, что все наблюдаемые значения (Xi,Yi) лежат на прямой регрессии Свойства коэффициента корреляции (продолжение)переменные не связаны линейной корреляционной связью. Линия регрессии проходит горизонтально. между переменными существует линейная корреляционная связь, которая тем лучше (ближе к линейной функциональной), чем ближе коэффициент корреляции по модулю к 1 Уравнение одно, коэффициенты корреляции разныеY Y X X Y = 3.0 + 0.8X Вопросы для самопроверкиЧто такое функциональная зависимость между переменными. Что такое статистическая зависимость. Что такое корреляционная зависимость. Дайте определение независимых переменных. Что такое линия регрессии. Какова основная идея метода наименьших квадратов. Какие меры близости точек к линии регрессии вы знаете. Почему мы называем расчетные коэффициенты линии регрессии «статистическими оценками». Как выбрать функциональную форму линии регрессии. Форы записи МНК коэффициента наклона ергрессионной прямой. В чем заключается экономический смысл случайной составляющей регрессионного уравнения. Для чего нужен коэффициент корреляции. Как связан коэффициент корреляции и коэффициент наклона линии регрессии. Перечислите свойства коэффициента корреляции. В каком случае линии регрессии по методу наименьших квадратов не существует. Темы лекцииМножественная линейная регрессионная модель Метод наименьших квадратов оценки коэффициентов МЛРМ. Матричное выражение МНК-оценок коэффициентов МЛРМ. Множественные регрессионные моделиНезависимая переменная Y характеризует состояние или поведение экономического объекта. Набор переменных X1,…,Xk, характеризуют этот экономический объект качественно или количественно. Предполагаем, что переменные X оказывают влияние на переменную Y, т. е. реализации переменной Y выступают в виде функции, значения которой определяются. правда, с некоторой погрешностью, значениями объясняющих переменных, выступающих в роли аргументов этой функции, т. е. Y = f(X1,…,Xk) + , где - случайная компонента МЛРМгде QD объем спроса на масло, Х доход, P цена на масло, PM цена на мягкое масло. Пример Здесь нам неизвестны коэффициенты и параметры распределения . Для их оценки имеется выборка из N наблюдений над переменными Y и X1,…,Xk. Для каждого наблюдения должно выполнятся следующее равенство: Матричная форма записи МЛРМгде Метод наименьших квадратовСреди всех возможных гиперплоскостей выбираем ту, для которой сумма квадратов остатков минимальна Что будем минимизироватьМинимизацияили Система нормальных уравненийИтогМНК оценки коэффициентов МЛРМ Полная мультиколлинеарностьКоэффициенты по методу наименьших квадратов существуют не всегда, а только в том случае, когда определитель матрицы (X’X) отличен от нуля. Определитель будет равен нулю в случае, если столбцы матрицы X линейно зависимы. Такое может произойти, если между независимыми переменными существует точное линейное соотношение. Примергде Y - средняя оценка на экзамене состоящую из трех объясняющих переменных: I доход родителей, D среднее число часов, затраченных на обучение в день, W среднее число часов, затраченных на обучение в неделю. Очевидно, что W=7D. Случай полной мультиколлинеарности отследить легко, поскольку в этом случае невозможно построить оценки по методу наименьших квадратов. Если в модели присутствует полная мультиколлинеарность, следует удалить из регрессионного уравнения одну из переменных, которые входят в линейное соотношение. Вопросы для самопроверкиСистема нормальных уравнений для нахождения коэффициентов по МНК. В каком случае линии регрессии по методу наименьших квадратов не существует Приведите примет модели, в которой присутствует полная мультиколлинеарность. Укажите размерности матриц, участвующих в формуле МНК-коэффициентов. .Как устранить проблему полной мультиколлинеарности. Выведите систему нормальных уравнений. Выведите матричную формулу МНК коэффициентов. Приведите пример ситуации, когда линейной зависимости между объясняющими переменными нет, а коэффииценты МЛРМ не существуют. Как влияют выбросы на результаты оценивания. Как исследовать устойчивость результатов оценивания. |