Эконометрика, лекции. 1 Составитель Е. А. Парышева Введение
Скачать 1.28 Mb.
|
, 1 , 0 . (Например, z=0, если потребитель не имеет высшего образования, z=1, если потребитель имеет высшее образование. Таким образом, кроме моделей, содержащих только количественные переменные i х, в регрессионном анализе рассматриваются также модели, содержащие лишь качественные переменные (обозначаемые z i ), либо те и другие одновременно. 1. Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA – моделями (моделями дисперсионного анализа. Например, зависимость начальной заработной платы от образования может быть записана так e gz a y , где z=0, если претендент на рабочее место не имеет высшего образования, z=1, если имеет. Тогда при отсутствии высшего образования начальная заработная плата равна , 0 ˆ a g a а при его наличии 1 ˆ g a g При этом параметра определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент g показывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования у претендента. Проверяя статистическую значимость коэффициента g с помощью t – статистики (или значение 2 R с помощью F- статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату. ANOVA – модели представляют собой кусочно–постоянные функции. Такие модели в экономике встречаются редко. 2. Гораздо чаще встречаются модели, содержащие как количественные, таки качественные переменные. Такие модели называются ANCOVA – моделями (моделями ковариационного анализа. Рассмотрим ANCOVA – модель при наличии у фиктивной переменной двух альтернатив. Простейшая модель с одной количественной и одной качественной переменными имеет вид , e gz bx Где у – заработная плата сотрудника фирмы, х – стаж работы, z – пол сотрудника, мужчина сотрудник если женщина сотрудник если Тогда для женщин ожидаемое значение заработной платы при х годах трудового стажа будет , ˆ bx а для мужчин – ˆ bx g a g bx Эти зависимости являются линейными относительно стажа работы хи различаются только величиной свободного члена. Если коэффициент g является статистически значимым, то можно сделать вывод, что в фирме имеет место дискриминация в заработной плате по половому Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 61 признаку. При g>0 она будет в пользу мужчин, при g<0 – в пользу женщин. На графике такие зависимости изображаются параллельными прямыми. Нулевой уровень (z = 0) качественной переменной называется базовым или сравнительным. Коэффициент g в модели называется дифференциальным коэффициентом свободного члена, т.к. он показывает, насколько отличается свободный член в модели при значении z = 1 от свободного члена при базовом значении фиктивной переменной. Кроме того, значения фиктивных переменных можно изменять на противоположные. Суть модели от этого не изменится. Изменится только знак коэффициента g в модели. 3. С помощью большего числа фиктивных переменных можно обрисовать более сложные ситуации. В этом случае может возникнуть ситуация, которая называется ловушкой фиктивной переменной. Она возникает, когда для моделирования k значений качественного признака используется ровно k бинарных (фиктивных) переменных. В этом случае одна из таких переменных линейно выражается через все остальные, и матрица значений переменных становится вырожденной. Тогда исследователь попадает в ситуацию совершенной мультиколлинеарности. Избежать подобной ловушки позволяет правило Если качественная переменная имеет k альтернативных значений, то при моделировании используется только (k-1) фиктивных переменных. Например, если качественная переменная имеет 3 уровня, то для моделирования достаточно двух фиктивных переменных z 1 и z 2 . Тогда для обозначения третьего уровня достаточно принять, например, обе переменные равными нулю z 1 =z 2 =0. В частности, для обозначения уровня экономического развития страны (развитая, развивающаяся или страна третьего мира) можно использовать обозначения развитая страна развитой является не страна z , 1 , 0 1 яся развивающа страна йся развивающе является не страна z , 1 , 0 Тогда z 1 =z 2 =0 означает страну третьего мира. Рассмотрим модель с двумя объясняющими переменными, одна из которых количественная, а другая – фиктивная, причем имеющая 3 альтернативы. Например, расходы на содержание ребёнка могут быть связаны с доходами домохозяйств и возрастом ребёнка: дошкольный, младший школьный и старший школьный. Т.к. качественная переменная связана с 3 альтернативами, то по общему правилу моделирования необходимо использовать 2 фиктивные переменные e z g z g bx у 2 1 1 , где у – расходы на содержание ребёнка, х – доходы домохо- зяйств, случае ожном противопол в возраст дошкольный z , 1 , 0 1 , случае ожном противопол в школьный младший или дошкольный z , 1 , 0 Тогда образуются частные уравнения регрессии для отдельного возраста - расходы на дошкольника ) 0 ( ˆ 2 1 z z bx у x 0 y a a+g Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 62 - расходы на младшего школьника bx g a у 1 z z ; - расходы на старшего школьника bx g g у 1 ) 1 , 1 ( 2 1 z Базовым значением качественной переменной является значение дошкольник, 2 1 , g g - дифференциальные свободные члены. То. получаем три параллельные регрессионные прямые После вычисления коэффициентов регрессий определяется статистическая значимость 2 1 , g g на основе обычных t – статистик. Если они оказываются статистически незначимыми, то можно сделать вывод, что возраст ребёнка не оказывает существенного влияния на расходы по его содержанию. 4. В отдельных случаях может оказаться необходимым введение двух и более фиктивных переменных. Для простоты рассмотрим регрессию с одной количественной и двумя качественными переменными. Пусть у – заработная плата сотрудников, х – стаж работы, z 1 – наличие высшего образования, z 2 – пол сотрудника. мужчина если женщина если z , 1 , 0 1 , азование высшее обр есть я образовани высшего нет z , 1 , 0 То. модель имеет виду Из неё получаем следующие зависимости - зарплата женщины без высшего образования ) 0 ( ˆ 2 1 z z bx у - зарплата женщины с высшим образованием bx g a у 1 z z ; - зарплата мужчины без высшего образования bx g a у 1 z z ; - зарплата мужчины с высшим образованием bx g g у 1 ) 1 , 1 ( 2 1 z Очевидно, что все отдельные регрессии отличаются друг от друга только свободным членом. Определение статистической значимости коэффициентов 2 1 , g g показывает, влияют ли образование и пол сотрудника на его зарплату. 5. Фиктивные переменные широко используются и для оценки сезонных различий в потреблении. Например, спрос на туристические путёвки, охлаждённую воду, мороженное существенно выше летом, чем зимой. Спрос на обогреватели, шубы – наоборот. Обычно сезонные колебания характерны для временных рядов. Устранение и нейтрализация сезонного фактора позволяет сконцентрироваться на других важных количественных и качественных характеристиках модели (тренде). Устранение сезонного фактора называется сезонной корректировкой. Существует несколько методов сезонной корректировки, одним из которых является метод фиктивных переменных. Пусть у зависит от количественной переменной х, причём зависимость отличается по кварталам, тогда общую модель можно представить в виде t t t t t t e z g z g z g bx у 3 2 2 1 1 , x 0 y a a+g 1 a+g 1 +g 2 Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 63 где случае ожном противопол в квартал II если z t , 0 , 1 1 , случае ожном противопол в квартал III если z t , 0 , 1 2 , случае ожном противопол в квартал IV если z t , 0 , 1 3 . I квартал – база. 6. Иногда (достаточно редко) фиктивные переменные могут быть использованы для объяснения поведения зависимой переменной (те. зависимая переменная является фиктивной. Например, исследуется зависимость наличия автомобиля от дохода, пола субъекта и т.п. Тогда есть если автомобиля нет если у , 1 , 0 Такие модели являются вероятностными (линейными) моделями e z g z g z g x b x b a у k m m 2 2 1 1 1 Зависимая переменная у принимает значение 0 с вероятностью рис вероятностью (р. Для оценки параметров линейно-вероятностной модели применяются методы Logit -, Probit-, Tobit- анализа. 7. Фиктивные переменные могут вводиться не только в линейные, но ив нелинейные модели, приводимые путём преобразования к линейному виду. Например, e g b b ух х m 1 Логарифмируем, e z g x b x b у m m ln 1 Наибольшими прогностическими возможностями обладают модели, зависящие от нескольких количественных факторов и от нескольких фиктивных. Влияние качественного фактора может сказываться не только назначении свободного члена, но и на угловом коэффициенте линейной регрессионной модели. Обычно это характерно для временных рядов экономических данных при изменении институциональных условий, введении новых правовых или налоговых ограничений. Тогда зависимость может быть выражена так e zx g z g bx a y 2 1 , где условий изменения после условий изменения до В этой ситуации ожидаемое значение зависимой переменной определяется следующим образом 1 z , ˆ 0 z , ˆ 2 1 x g b g a y bx Коэффициенты g 1 и g 2 называются соответственно дифференциальным свободным членом и дифференциальным угловым коэффициентом. Фиктивная переменная разбивает зависимость на две части – дои после внесения изменений в условия её действия. Общая зависимость имеет вид кусочно – линейной функции, а изменения условий отображаются изменением угла наклона прямой коси абсцисс (линии 1 – 2). х 1 3 2 ух Здесь исследователь должен принять решение, стоит ли разбивать выборку на части и строить для каждой из них уравнение регрессии (прямые 1 и 2) или ограничиться одной общей линией регрессии (линия 3). Для этого используют тест Чоу, который опирается на статистику 1 2 2 2 1 2 1 0 m m n s s s s s F , (см. тема Статистика Фишера в регрессионном анализе. Если гипотеза о структурной стабильности выборки отклоняется, то исследуется вопрос о причинах структурных различий в подвыборках. Пусть данные в подвыборках описываются двумя уравнениями регрессии ˆ , ˆ 2 2 1 1 x b a y x b a Тогда возможны следующие варианты 1. Различие между аи а является статистически значимым, а коэффициенты b 1 и статистически не различаются. При этом наблюдается скачкообразное изменение зависимости при сохранении наклона линии регрессии. 2. Различие между b 1 и статистически значимо, а различие между аи а статистически незначимо. 3. Статистически значимыми являются и различия между аи аи различия между b 1 и Для тестирования всех этих ситуаций применяется следующая методика, предложенная Гуйарати. Она основана на включении в модель регрессии фиктивной переменной z, которая равна 1 для всех x * . Далее определяются параметры следующего уравнения регрессии e dzx cx bz Отсюда видно, что а 1 =(а+b); b 1 =(c+d) (z=1), a 2 =a; b 2 =b; (z=0). Следовательно, параметр b есть разница между a 1 и а, параметр d – разница между b 1 и b 2 . Если в уравнении b является статистически значимым, а d – нетто имеем первый вариант структурной перестройки. Если, наоборот, статистически значимым является d, а b – незначим, имеем второй вариант структурных изменений. Наконец, третий вариант имеем в случае, если оба коэффициента b и d являются статистически значимыми. В заключение следует отметить, что преимущество метода Гуйарати перед тестом Чоу состоит в том, что нужно построить только одно, а не три уравнения регрессии. Тема 10. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ 10.1. Общее понятие о системах уравнений, используемых в эконометрике Объектом статистического изучения в социальных науках являются сложные системы. Построение изолированных уравнений регрессии недостаточно для описания таких систем и объяснения механизма их функционирования. Поэтому при моделировании экономических ситуаций часто необходимо построение систем уравнений, когда одни и те же переменные могут выступать ив роли объясняющих ив роли объясняемых. Так, если изучается модель спроса как отношение цени количества потребляе- 1 2 ух х 2 ух х 2 ух х by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 65 мых товаров, то одновременно для прогнозирования спроса необходима модель предложения товаров, в которой рассматривается также взаимосвязь между количеством и ценой предлагаемых благ. Это позволяет достичь равновесия между спросом и предложением. Система уравнений в эконометрических исследованиях может быть построена по- разному. Системы уравнений здесь могут быть построены по-разному. Возможна система независимых уравнений, когда каждая зависимая переменная y рассматривается как функция одного итого же набора факторов x: 2 2 1 1 0 , 2 2 2 22 1 21 20 2 , 1 1 2 12 1 11 10 1 n m nm n n n n m m m m x a x a ау ха ха хау ахах ау) Набор факторов x j в каждом уравнении может варьироваться. Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно. Для нахождения его параметров используется МНК. По существу, каждое уравнение этой системы является уравнением регрессии. Если зависимая переменная y одного уравнения выступает в виде фактора x в другом уравнении, то исследователь может строить модель в виде системы рекурсивных уравнений 1 11 1 12 2 1 1 2 21 1 21 1 22 2 2 2 3 31 1 32 2 21 1 22 2 2 2 1 1 , 1 1 , , , n n n n n n m m m m m y a x a x a x y b y a x a x a x y b y b y a x a x a x y b y b y a 1 1 2 2 m m mn n m x a x a x (2) В данной системе зависимая переменная y включает в каждое последующее уравнение в качестве факторов все зависимые переменные предшествующих уравнений наряду с набором факторов x . Каждое уравнение этой системы может рассматриваться самостоятельно, и его параметры определяются методом наименьших квадратов (МНК). Наибольшее распространение в эконометрических исследованиях получила система взаимозависимых уравнений. В ней одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других уравнениях – в правую часть системы 1 1 1 1 , 2 2 1 1 , 2 2 1 21 2 3 23 1 21 2 , 1 1 1 11 1 3 13 2 12 1 n m nm n n n n n n n m m n n m m n n x a x a y b y b y у ах ау а ау) Система взаимозависимых уравнений получила название системы совместных, одновременных уравнений. Тем самым подчеркивается, что в системе одни и те же переменные одновременно рассматриваются как зависимые в одних уравнениях и как независимые в других. В эконометрике эта система уравнений называется также структурной формой модели. В отличие от предыдущих систем каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК неприменим. С этой целью используются специальные приемы оценивания. 10.2. Структурная и приведенная формы модели Экономическая модель как система одновременных уравнений может быть представлена в структурной или приведённой форме. В структурной форме её уравнения имеют исходный вид, отражая непосредственную связь между переменными. Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 66 Структурная форма модели обычно содержит эндогенные и экзогенные переменные. Эндогенные переменные (внутренние) – это зависимые переменные, число которых равно числу уравнений в системе. Они обозначаются через y. Экзогенные переменные (внешние) – это предопределенные переменные (задаваемые извне, независимые, влияющие на эндогенные переменные. Они обозначаются через x. Классификация переменных на эндогенные и экзогенные зависит от теоретической концепции принятой модели. Экономические переменные могут выступать в одних моделях как эндогенные, а в других – как экзогенные переменные. Внеэкономические переменные (например, климатические условия) входят в систему как экзогенные переменные. В качестве экзогенных переменных можно рассматривать значения эндогенных переменных за предшествующий период времени (лаговые переменные. Например, потребление текущего года y t может зависеть также и от уровня потребления в предыдущем году y Структурная форма модели позволяет увидеть влияние изменений любой экзогенной переменной назначения эндогенной переменной. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно заранее иметь целевые значения эндогенных переменных. Простейшая структурная форма модели имеет виду) где y 0> |