эконометрика шпора. 1. Назначение эконометрических моделей. Принципы их спецификации Типы переменных в эконометрических моделях
Скачать 3.03 Mb.
|
40. Способы включения случайных возмущений в спецификацию нелинейной по параметрам модели. В моделях логарифмического типа для линеаризации исходных нелинейных уравнений регрессии используется операция логарифмирования. Этому же преобразованию подвергается и случайное возмущение. Для того чтобы в линейное уравнение после линеаризации возмущение входило аддитивно, в исходную нелинейную спецификацию оно должно включаться мультипликативно, изменяя значение эндогенной переменной в некоторой случайной пропорции. Например, модель: Y = A* X β *ν, (1) Y = A* X β ∗ e ε , (2) Y = A* X β + ε, (3) где ν, ε – случайные возмущения. Путём логарифмирования преобразуем модель в парную логарифмическую: ln(Y) = α + β*ln(X) + ε. Случайное возмущение ε=ln(ν) включено в линейную спецификацию аддитивно. Для удовлетворения условиям нормальной линейной регрессионной модели возмущение ν исходной нелинейной спецификации должно иметь логарифмическое нормальное(логнормальое) распределение с параметрами: E{ ν}=e σ 2 /2 , Var{ν} = e σ 2 (e σ 2 − 1). Значение ε = ln(ν) = 0, при ν = 1, что не приводит к изменениям эндогенной переменной в спецификации (1). Линеаризация спецификации (2) также приводит к линейной модели вида: ln(Y) = α + β*ln(X) + ε , но случайное возмущение ε имеет нормальное распределение (а не логарифмически нормальное, как в предыдущем случае) с параметрами E{ ε} = 0, Var{ε} = σ 2 . Поэтому применение МНК не вызывает затруднений, ε =0 не приводит к изменениям значений эндогенной переменной. Логарифмическое преобразование нелинейной спецификации (3) с аддитивным случайным возмущением не приводит к линейной модели: ln(Y) = ln(A*X β + ε), поэтому непосредственное применение обычного МНК в данном случае невозможно. 54 41. Спецификация и оценивание МНК эконометрических моделей нелинейных по переменным. В моделях, нелинейных по параметрам, например степенных или показательных, непосредственное применение МНК для их оценки невозможно, так как необходимым условием применимости МНК является линейность по коэффициентам уравнения регрессии. В данном случае преобразованием, которое приводит уравнение регрессии к линейному виду, является логарифмирование. Степенная 𝑓 = 𝑎 ∗ 𝑋 𝑏 Параметр a — уровень эндогенной переменной, который устанавливается при больших значениях регрессора Параметр b характеризует скорость приближения к данному уровню. Показательная (экспоненциальная) 𝑓 = 𝑎 ∗ 𝑒 𝑏𝑋 Гиперболическая 𝑓 = 𝑎 + 𝑏 𝑋 Полиномиальная 𝑓 = ∑ 𝑖=1 𝑛 𝑎 𝑖 ∗ 𝑋 𝑖 Двойная логарифмическая модель: используются для построения производственных функций, функций потребления, функций спроса и т.д. • Модель с постоянной эластичностью: 𝑙𝑛(𝑌) = 𝑙𝑛(𝐴) + 𝛽 ∗ 𝑙𝑛(𝑋) = 𝛼 + 𝛽 ∗ 𝑙𝑛(𝑋) • Замена переменных: 𝑌 = 𝑙𝑛(𝑌); 𝛼 = 𝑙𝑛(𝐴); 𝑋 = 𝑙𝑛(𝑋) • Результат линеаризация уравнения регрессии: 𝑌 = 𝛼 + 𝛽𝑋 Полулогарифмические модели • Лог-линейная модель: 𝑙𝑛(𝑌) = 𝛼 + 𝛽 ∗ 𝑋; 𝑌 = 𝑙𝑛(𝑌) • Интерпретация параметра: 𝑑(𝑙𝑛𝑌) 𝑑𝑋 = 1 𝑌 ∗ 𝑑𝑌 𝑑𝑋 = 𝑑𝑌/𝑌 𝑑𝑋 Параметр характеризует отношение относительного изменения Y к абсолютному изменению Х и имеет смысл темпа прироста переменной Y по переменной Х. • Линейно-логарифмическая модель: 𝑌 = 𝛼 + 𝛽 ∗ 𝑙𝑛(𝑋); 𝑋 = 𝑙𝑛(𝑋) • Интерпретация параметра: 𝑑(𝑌) 𝑑𝑋 = 𝛽 1 𝑋 ; 𝛽 = 𝑑𝑌 𝑑𝑋/𝑋 55 Параметр характеризует отношение абсолютного изменения Y к относительному изменению Х. Во всех случаях получаем спецификации линейной модели, к которой при соответствующем включении случайного возмущения применим МНК. Характе ристики случайного возмущения Спецификация Исходная После линеаризации Исходная После линеаризации 𝒀 = 𝑨 ∗ 𝑿 𝜷 ∗ 𝒗 𝒍𝒏(𝒀) = 𝜶 + 𝜷 ∗ 𝒍𝒏(𝑿) + 𝜺 𝒀 = 𝑨 ∗ 𝑿 𝜷 ∗ 𝒆 𝜺 𝒍𝒏(𝒀) = 𝜶 + 𝜷 ∗ 𝒍𝒏(𝑿) + 𝜺 Математ ическое ожидание 𝐸(𝑣) = 𝑒 (𝜎 2 /2) 𝐸(𝜀) = 0 𝐸(𝜀) = 0 𝐸(𝜀) = 0 Дисперси я 𝑉𝑎𝑟(𝑣) = 𝑒 𝜎 2 (𝑒 𝜎 2 − 1) 𝑉𝑎𝑟(𝜀) = 𝜎 2 𝑉𝑎𝑟(𝜀) = 𝜎 2 𝑉𝑎𝑟(𝜀) = 𝜎 2 Закон распределения Логнормальный Нормальный Нормальный Нормальный 56 42. Ошибки спецификации: типы, последствия, тесты на обнаружение Правильная спецификация уравнения регрессии означает, что оно в целом верно, отражает соотношение между экономическими показателями, участвующими в модели. Это является необходимой предпосылкой дальнейшего качественного оценивания. Неправильный выбор функциональной формы или набора объясняющих переменных называется ошибками спецификации. Рассмотрим основные типы ошибок спецификации. Возможные ошибки спецификации модели: 1. Неправильный выбор вида уравнения регрессии: Пусть на первом этапе была сделана спецификация модели в виде: в которой функция F(x,a0,a1) выбрана не верно. Предположим, что yT=fT(x,a0,a1)+v – правильный вид функции регрессии. Тогда справедливо выражение: . Из выражения следует: Иными словами, математические ожидания эндогенной переменной, полученные с помощью функций fT и fF не совпадают, т.е. первая предпосылка теоремы Гаусса- Маркова M(ulx)=0 не выполняется. Следовательно, в результате оценивания такой модели параметры а0 и а1 будут смещенными. В таком случае следует, используя диаграмму рассеивания, выбрать из арсенала моделей функций регрессии более подходящую кандидатуру и повторить процедуру построения регрессионной модели. 2. В уравнение регрессии включена лишняя (незначимая) переменная: Пусть на этапе спецификации в модель включена «лишняя» переменная, например, X2: «Правильная» спецификация должна иметь вид: Последствия: 1) Оценки параметров а0, а1, а2 останутся несмещенными, но потеряют свою эффективность (точность).2) Увеличивается ошибка прогноза по модели как за счет ошибок оценок коэффициентов и σu, 57 так и за счет последнего слагаемого. Диагностика: В моделях множественной регрессии необходимо для каждого коэффициента уравнения проверять статистическую гипотезу H0: ai=0. Для этого достаточно оценить дробь Стьюдента и сравнить ее значение с критическим значением распределения Стьюдента, которое вычисляется по значению доверительной вероятности и значению степени свободы n2 = n – (k+1). Если неравенство справедливо, то переменная принимается незначимой и может быть удалена из спецификации модели.ё 3. В уравнении регрессии пропущена значимая переменная: . Последствия такие же, как и в первом случае: получаем смещенные оценки параметров модели. Для устранения необходимо вернуться к изучению особенностей поведения экономического объекта, выявить опущенные переменные и дополнить ими модель. Проблемы в использовании переменных: 1) Невозможно получение данных по переменной. 2) Невозможно измерить количественно переменную. Такие ситуации характерны для переменных социально-экономического характера. Выход из ситуации – подбор переменной заместителя. В качестве замещающей переменной часто используется время и лаговые переменные. a) Исследование остатков регрессионной модели Анализ остатков e i позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределённые величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-либо зависимости, не учтённой в модели. На практике обычно полагают, что остатки должны быть распределены по нормальному закону (т.е. должны вести как «гауссов белый шум»). b) Тест Рамсея RESET 58 Суть теста Рамсея RESET состоит в следующем. Оценивается линейная модель вида (6.54) Затем анализируются графически зависимость . Так, если она может быть представлена явной функциональной зависимостью , то в данную зависимость вводят в исходное уравнение регрессии (6.52) и затем оценивают уравнение (6.55) После этого сравнивают два уравнения регрессии (6.58) и (6.59), например, при помощи критерия Фишера (для линейных уравнений): . (6.56) Здесь n – число наблюдений, m 1 – число параметров в исходной модели m 2 – число параметров в новой модели. Статистика F имеет распределение Фишера с числами степеней свободы n 1 =n–m 1 , n 2 =n–m 2 . Если F–статистика окажется статистически значимой, то это означает, что исходное уравнение регрессии было неправильно специфицировано. В случае простой линейной модели (6.58) можно использовать и такой критерий Фишера Здесь k – число параметров в новой модели, r – число новых регрессоров. В этом случае, статистика F имеет распределение Фишера с числами степеней свободы n 1 =r, n 2 =n–k. . (6.57) Здесь k – число параметров в новой модели, r – число новых регрессоров. В этом случае, статистика F имеет распределение Фишера с числами степеней свободы n 1 =r, n 2 =n–k. 59 42. Фиктивная переменная сдвига: спецификация регрессионной модели с фиктивной переменной сдвига, смысл параметра при фиктивной переменной. Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. Фиктивная переменная сдвига - это переменная, которая меняет точку пересечения линии регрессии с осью ординат в случае применения качественной переменной. Спецификация регрессионной модели с фиктивной переменной сдвига t t t t d X Y a, b, d - параметры модели фиктивная переменная 1 – базовое значение ФП При замене базового значения меняется только свободный член Условное математическое ожидание зависимой переменной При При Интерпретация параметра d Параметр — это среднее изменение изучаемого признака при переходе из одной категории в другую при неизменных значениях остальных параметров 1 0 t d t t t X d Y E 1 t t t X d Y E 0 0 t d 1 t d t t t t d X Y 60 43. Применение фиктивных переменных сдвига при исследовании сезонных колебаний: спецификация модели; проблема мультиколлинеарности; смысл параметров при фиктивных переменных. Правило включения нескольких ФП сдвига если качественная переменная имеет mальтернативных значений, то для устранения мультиколлинеарности при моделировании используется только m-1 фиктивная переменная. Мультиколлинеарность Определение: Линейная зависимость двух или нескольких регрессоров называется мультиколлинеарностью. Строгая функциональная зависимость между регрессорами называется полной мультиколлинеарностью. Последствия полной мультиколлинеарности Матрица Q – не определенa Матрица X T X – вырождена Спецификация модели Взаимосвязь между фиктивными переменными Базовый (сравнительный) период – осень Оцениваемая спецификация t t t t t d d d Y 3 3 2 2 1 1 0 Среднемесячный объем потребления по сезонам Условное математическое ожидание зависимой переменной: осенний период зимний период 1 0 3 , 2 , 0 i d Y E ti t весенний период 2 0 3 , 1 , 0 i d Y E ti t 1 4 3 2 1 t t t t d d d d 0 3 , 2 , 1 , 0 i d Y E ti t k X X ra n k X ra n k T ) ( ) ( 0 ) d et( X X T 61 летний период 3 0 2 , 1 , 0 i d Y E ti t Вывод: Параметры при фиктивных переменных показывают средние сезонные отклонения в объеме потребления по отношению к осеннему (базовому) месяцу. Проверка нулевой гипотезы о несущественном изменении потребления товара в i –м сезоне по сравнению с осенью Оцененная спецификация ) ( 3 ) ( 3 2 ) ( 2 1 ) ( 1 ) ( 0 3 ˆ 2 ˆ 1 ˆ 0 ˆ ˆ ˆ ˆ ˆ S t t S t S t S S t e d d d Y Если нулевая гипотеза не отклоняется, т.е. потребление в сезоне i несущественно изменяется по сравнению с осенью кр i i t S ˆ ˆ , 0 : 0 i H 3 , 2 , 1 i 62 44. Фиктивная переменная наклона: назначение; спецификация регрессионной модели; смысл параметра при фиктивной переменной. Фиктивные (искусственные) переменные (dummy variables)- это переменные с дискретным множеством значений, которые количественным образом описывают качественные признаки. В регрессионных моделях применяются фиктивные переменные двух типов: переменные сдвига и переменные наклона. Фиктивная переменная наклона изменяет наклон линии регрессии. При помощи фиктивных переменных наклона можно построить кусочно-линейные модели, которые позволяют учесть структурные изменения в экономических процессах (например, введение новых правовых или налоговых ограничений, изменение политической ситуации и т. д.). Спецификация регрессионной модели в этом случае (например, для парной регрессионной модели, для простоты) имеет вид: 0 – до структурных изменений d t = 1 – после структурных изменений, x` d t - бинарная переменная Фиктивная переменная входит в уравнение в мультипликативной форме. Коэффициент наклона регрессионной линии: При При Условное математическое ожидание зависимой переменной t t t t t X d X Y При При 0 0 при , 1 при , 0 t t t t d t t t t X d Y E 0 0 t d t t t t t X X X d Y E 1 1 t d 63 Фиктивная переменная наклона Проверка нулевой гипотезы о несущественном влиянии структурных изменений Оцененная спецификация ) ( ) ( 3 ) ( 2 ) ( 1 3 ˆ 2 ˆ 1 ˆ ˆ ˆ ˆ S t t t S t S S t e d X X Y Если кр t S 3 ˆ 3 ˆ 1. нулевая гипотеза 0 : 3 0 H не отвергается Y X ) ( X X 64 45. Тест Чоу на значимость структурных изменений. Назначение — проверка значимости структурных изменений в выборочных данных Алгоритм теста Чоу: Шаг 1 Деление выборки объемом n на две частные – объемами n 1 и n 2 n n n 2 1 Шаг 2 Оценка трех регрессионных моделей Суммы квадратов остатков регрессий для выборки объемом n n t t e ESS S 1 2 0 0 для выборки объемом |