Главная страница

Эконометрика, лекции. 1 Составитель Е. А. Парышева Введение


Скачать 1.28 Mb.
Название1 Составитель Е. А. Парышева Введение
АнкорЭконометрика, лекции.pdf
Дата18.07.2018
Размер1.28 Mb.
Формат файлаpdf
Имя файлаЭконометрика, лекции.pdf
ТипДокументы
#21642
страница7 из 13
1   2   3   4   5   6   7   8   9   10   ...   13
,
:
2 2
2 0
2 пе ее Hкоторая предполагает отсутствие гетероскедастичности. Для проверки этой гипотезы рассчитывается отношение
1 2
S
S
F
набл

, которое имеет распределение Фишера с


1
;
1




m k
m k
степеней свободы (здесь m – число объясняющих переменных. Если


1
;
1
;





m k
m кр набл

, то гипотеза об отсутствии гетероскедастичности отклоняется при уровне значимости α. Этот же тест может быть использован и при предположении об обратной пропорциональности между дисперсией и значениями объясняющей переменной


2 2
2
i e
x i


. В этом случае статистика Фишера принимает вид
2 1
S
S
F При установлении гетероскедастичности возникает необходимость преобразования модели с целью устранения данного недостатка. Вид преобразования зависит оттого, известны или нет дисперсии отклонений
2
i е

Обобщенный метод наименьших квадратов (ОМНК) При нарушении гомоскедастичности и наличии автокорреляции ошибок рекомендуется традиционный метод наименьших квадратов заменять обобщенным методом наименьших квадратов (ОМНК). Обобщенный метод наименьших квадратов применяется к преобразованным данными позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Остановимся на использовании ОМНК для корректировки ге- тероскедастичности. Рассмотрим ОМНК для корректировки гетероскедастичности. Будем предполагать, что среднее значение остаточных величин равно нулю
0
)
(

i е
М
, а дисперсия пропорциональна величине i
K
, те.
2 2




i e
K
i
, где
2
i e

– дисперсия ошибки при конкретном м значении фактора
2

– постоянная дисперсия ошибки при соблюдении предпосылки о гомоскедастичности остатков i
K
– коэффициент пропорциональности, меняющийся с изменением величины фактора, что и обусловливает неоднородность дисперсии.
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

42 При этом предполагается, что
2

неизвестна, а в отношении величин i
K
выдвигаются определенные гипотезы, характеризующие структуру гетероскедастичности. В общем виде для уравнения i
i е bx a
y



модель примет вид i
i i
i e
K
bx В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокор- реляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные входе го наблюдения, на i
K
. Тогда дисперсия остатков будет величиной постоянной, те Иными словами, от регрессии y
по x
мы перейдем к регрессии на новых переменных y
K и x
K
. Уравнение регрессии примет вида исходные данные для данного уравнения будут иметь вид
1 1
2 2
n n
y
K
y
K
y y
K

,
1 1
2 2
n n
x
K
x
K
x По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешенную регрессию, в которой переменные y
и x
взяты с весами Оценка параметров нового уравнения с преобразованными переменными приводит к взвешенному методу наименьших квадратов, для которого необходимо минимизировать сумму квадратов отклонений вида




2 1
1
,
n i
i i
i
S a b y
a Соответственно получим следующую систему нормальных уравнений



















,
1 2
i i
i i
i i
i i
i i
i i
K
y x
K
x b
K
x a
K
y
K
x b
K
a






2
)
(
1
)
)(
(
1
x x
K
y y
x x
K
b i
i i
i i
, Те. коэффициент регрессии b
при использовании обобщенного МНК с целью корректировки гетероскедастичности представляет собой взвешенную величину по отношению к обычному МНК с весом
1 K
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

43 Если преобразованные переменные x
и y
взять в отклонениях от средних уровней, то коэффициент регрессии b
можно определить как
2 1
1
x y
K
b x
K
 При обычном применении метода наименьших квадратов к уравнению линейной регрессии для переменных в отклонениях от средних уровней коэффициент регрессии b
определяется по формуле
2
x y Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Для применения ОМНК необходимо знать фактические значения дисперсий отклонений
2
i e

. На практике такие значения известны крайне редко. Поэтому, чтобы применить ВНК, необходимо сделать реалистические предположения о значениях
2
i e

. В эконометрических исследованиях чаще всего предполагается, что дисперсии отклонений пропорциональны или значениям, или значениям
2
i x
, тех или
2 2
2




i х Если предположить, что дисперсии пропорциональны значениям фактора x, тех, тогда уравнение парной регрессии i
i е bx a
y



преобразуется делением его левой и правой частей на i
x
: i
i i
i i
i i
x е x
b x
a Или i
i i
i i
v x
b x
a Здесь для случайных отклонений i
i i
x е выполняется условие гомоскедастичности. Следовательно, для регрессии применим обычный МНК. Следует отметить, что новая регрессия не имеет свободного члена, но зависит от двух факторов. Оценив для неё по МНК коэффициенты аи, возвращаемся к исходному уравнению регрессии. Если предположить, что дисперсии
2 2
2




i х i
, то соответствующим преобразованием будет деление уравнения парной регрессии i
i е bx a
y



на x i
: i
i i
i i
x е x
a или, если переобозначить остатки как i
i i
x е i
i i
i v
b x
a Здесь для отклонений v i
также выполняется условие гомоскедастичности. В полученной регрессии по сравнению с исходным уравнением параметры поменялись ролями свободный члена стал коэффициентом, а коэффициент b – свободным членом. Применяя обычный МНК в преобразованных переменных i
i i
i i
x z
x y
y
1
;
*


,
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

44 получим оценки параметров, после чего возвращаемся к исходному уравнению. Пример. Рассматривая зависимость сбережений y
от дохода x
, по первоначальным данным было получено уравнение регрессии 0,1178
y Применяя обобщенный МНК к данной модели в предположении, что ошибки пропорциональны доходу, было получено уравнение для преобразованных данных
1 0,1026 0,8538
y Коэффициент регрессии первого уравнения сравнивают со свободным членом второго уравнения, те. 0,1178 и 0,1026 – оценки параметра b
зависимости сбережений от дохода. В случае множественной регрессии е b
x b
x b
a y
m m






ˆ
2 2
1 1
, Если предположить
2 2
1 2




i х i
(те. дисперсия ошибок пропорциональна квадрату первой объясняющей переменной, тов этом случае обобщенный МНК предполагает оценку параметров следующего трансформированного уравнения
2 1
2 1
1 1
m m
x y
x b
b b
x Следует иметь ввиду, что новые преобразованные переменные получают новое экономическое содержание и их регрессия имеет иной смысл, чем регрессия по исходным данным. Пример. Пусть y
– издержки производства,
1
x
– объем продукции,
2
x
– основные производственные фонды,
3
x
– численность работников, тогда уравнение
1 1 2
2 3 3
y a b x b x b x является моделью издержек производства с объемными факторами. Предполагая, что
2
i


пропорциональна квадрату численности работников
3
x
, мы получим в качестве результативного признака затраты на одного работника
3
y x
, а в качестве факторов следующие показатели производительность труда
1 3
x x и фондовооруженность труда
2 3
x x
. Соответственно трансформированная модель примет вид
1 2
3 1
2 3
3 3
y x
x b
b b
x x
x





, где параметры
1
b
,
2
b
,
3
b численно не совпадают с аналогичными параметрами предыдущей модели. Кроме этого, коэффициенты регрессии меняют экономическое содержание из показателей силы связи, характеризующих среднее абсолютное изменение издержек производства с изменением абсолютной величины соответствующего фактора на единицу, они фиксируют при обобщенном МНК среднее изменение затратна работника с изменением производительности труда на единицу при неизменном уровне фовдовооруженности труда и с изменением фондовооруженности труда на единицу при неизменном уровне производительности труда. Если предположить, что в модели с первоначальными переменными дисперсия остатков пропорциональна квадрату объема продукции,
2 2
2 1
i x





, можно перейти к уравнению регрессии вида
3 2
1 2
3 1
1 1
x y
x b
b b
x x
x





Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

45 В нем новые переменные
1
y x
– затраты на единицу (или на 1 руб. продукции,
2 1
x x
фондоемкость продукции,
3 1
x x
– трудоемкость продукции. В заключение следует отметить, что обнаружении гетероскедастичности и её корректировка являются весьма серьёзной и трудоёмкой проблемой. В случае применения обобщённого взвешенного) МНК необходима определённая информация или обоснованные предположения о величинах
2
i Тема 6. Множественная корреляция и линейная регрессия Значения экономических переменных обычно определяется влиянием не одного, а нескольких факторов. Например, спрос на некоторое благо определяется не только ценой данного блага, но и ценами на замещающие и дополняющие блага, доходом потребителей и многими другими факторами. В этом случае вместо парной регрессии рассматривается множественная регрессия, где y
– зависимая переменная (результативный признак, i
x
– независимые, или объясняющие, переменные (признаки-факторы). Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии
– построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
6.1. Спецификация модели. Отбор факторов при построении уравнения множественной регрессии Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов отбор факторов и выбор вида уравнения регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
2. Факторы не должны быть интеркоррелированы (интеркорреляция – корреляция между объясняющими переменными) и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором m
факторов, то для нее рассчитывается показатель детерминации
2
R
, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии m
факторов. Влияние других, неучтенных в модели факторов, оценивается как
2 1 R

с соответствующей остаточной дисперсией При дополнительном включении в регрессию
1
m 
фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться
2 2
1
m и
2 2
1
m m
S
S


Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

46 Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор
1
m x

не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента. Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии на первой подбираются факторы исходя из сущности проблемы на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии. Коэффициенты интеркорреляции позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, те. находятся между собой в линейной зависимости, если
0,7
i j x x r

. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, атому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. Пусть, например, при изучении зависимости


1 2
3
, ,
y f x x x

матрица парных коэффициентов корреляции оказалась следующей y
1
x
2
x
3
x y
1 0,8 0,7 0,6 1
x
0,8 1
0,8 0,5 2
x
0,7 0,8 1
0,2 3
x
0,6 0,5 0,2 1 Очевидно, что факторы
1
x и
2
x дублируют друг друга. В анализ целесообразно включить фактора нехотя корреляция
2
x с результатом y
слабее, чем корреляция фактора
1
x с y


2 1
0, 7 0,8
yx yx r
r



, но зато значительно слабее межфакторная корреляция
2 3 1 3 0, 2 0,5
x x x x r
r



. Поэтому в данном случаев уравнение множественной регрессии включаются факторы
2
x
, По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеар- ность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, те. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий
1. Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в чистом виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл.
Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

47 2. Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку, что делает модель непригодной для анализа и прогнозирования. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы i j x x r


i j

были бы равны нулю. Так, для уравнения, включающего три объясняющих переменных

1 1 2
2 3 3
y a
b x b x b матрица коэффициентов корреляции между факторами имела бы определитель, равный единице
1 1 1 2 1 3 2 1 2 2 2 3 3 1 3 2 3 3 1
0 0
Det
0 1
0 1
0 0
1
x x x x x x x x x x x x x x x x x x r
r r
r r
r r
r Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю
1 1 1 2 1 3 2 1 2 2 2 3 3 1 3 2 3 3 1 1 1
Det
1 1 1 0
1 1 1
x x x x x x x x x x x x x x x x x x r
r r
r r
r r
r Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее муль- тиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мульти- коллинеарность факторов. Существует ряд подходов преодоления сильной межфакторной корреляции. Самый простой путь устранения мультиколлинеарности состоит в исключении из модели одного или нескольких факторов. Другой подход связан с преобразованием факторов, при котором уменьшается корреляция между ними. Одним из путей учета внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, тек уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если
1   2   3   4   5   6   7   8   9   10   ...   13


написать администратору сайта