Эконометрика, лекции. 1 Составитель Е. А. Парышева Введение
Скачать 1.28 Mb.
|
от теоретических значений x Возможны следующие случаи, если i зависит от x y то а остатки i неслучайны б остатки i не имеют постоянной дисперсии в остатки i носят систематический характер Рис. 2. Зависимость случайных остатков i от теоретических значений x В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки i не будут случайными величинами. 5.3.2. Проверка второй предпосылки МНК Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что 0 x y y (или 0 i е. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. Вместе стем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин x , что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков i от теоретических значений результативного признака x y строится график зависимости случайных остатков i от факторов, включенных в регрессию j x (рис. 3). Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 35 Рис. .3. Зависимость величины остатков от величины фактора Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений j x . Если же график показывает наличие зависимости i и j x , то модель неадекватна. Причины неадекватности могут быть разные. Возможно, что нарушена третья предпосылка МНК и дисперсия остатков непостоянна для каждого значения фактора j x . Может быть неправильна спецификация модели ив нее необходимо ввести дополнительные члены от j x , например 2 j x . Скопление точек в определенных участках значений фактора j x говорит о наличии систематической погрешности модели. Замечание. Предпосылка о нормальном распределении остатков (пятая предпосылка) позволяет проводить проверку параметров регрессии и корреляции с помощью F - и критериев. Вместе стем, оценки регрессии, найденные с применением МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков, те. при нарушении пятой предпосылки МНК. Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок. 5.3.3. Автокорреляция ошибок. Статистика Дарбина-Уотсона Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений i от значений отклонений во всех других наблюдениях. Отсутствие зависимости гарантирует отсутствие коррелированности между любыми отклонениями, те. j i j i , cov ив частности, между соседними отклонениями 0 , cov 1 i i Автокорреляция (последовательная корреляция) остатков определяется как корреляция между соседними значениями случайных отклонений во времени (временные ряды) или в пространстве (перекрестные данные. Она обычно встречается во временных рядах и очень редко в пространственных данных. Возможны следующие случаи Случай положительной автокорреляции ошибок регрессии, когда знаки соседних отклонений, как правило, совпадают между собой ( 1 i i e е. Случай отрицательной автокорреляции, когда соседние отклонения имеют как правило противоположные знаки ( 1 i i e е. Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 36 Эти случаи могут свидетельствовать о возможности улучшить уравнение путём оценива- ния новой нелинейной формулы или включения новой объясняющей переменной. В экономических задачах значительно чаще встречается положительная автокорреляция, чем отрицательная автокорреляция. Если же характер отклонений случаен, то можно предположить, что в половине случаев знаки соседних отклонений совпадают, а в половине – различны. Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу. 1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака. 2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени От истинной автокорреляции остатков следует отличать ситуации, когда причина авто- корреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках. Для обнаружения автокорреляции используют либо графический метод. Либо статистические тесты. Графический метод заключается в построении графика зависимости ошибок от времени в случае временных рядов) или от объясняющих переменных и визуальном определении наличия или отсутствия автокорреляции. Наиболее известный критерий обнаружения автокорреляции первого порядка – критерий Дарбина-Уотсона. Статистика DW Дарбина-Уотсона приводится во всех специальных компьютерных программах как одна из важнейших характеристик качества регрессионной модели. Сначала по построенному эмпирическому уравнению регрессии определяются значения отклонений. А затем рассчитывается статистика Дарбина-Уотсона по формуле n i i n i i i e e e DW 1 2 2 Статистика DW изменяется от 0 до 4. DW=0 соответствует положительной автокорреля- ции, при отрицательной автокорреляции DW=4. Когда автокорреляция отсутствует, коэффициент автокорреляции равен нулю, и статистика DW = 2. Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза 0 H об отсутствии автокорреляции остатков. Альтернативные гипотезы Ни Н состоят, соответственно, в наличии положительной или отрицательной авто- корреляции в остатках. Далее по специальным таблицам определяются критические значения Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 37 критерия Дарбина-Уотсона L d (- нижняя граница признания положительной автокорреляции) и верхняя граница признания отсутствия положительной автокорреляции) для заданного числа наблюдений n , числа независимых переменных модели m и уровня значимости . По этим значениям числовой промежуток 0; 4 разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью 1 осуществляется следующим образом l d DW 0 – положительная автокорреляция, принимается Н u l d DW d – зона неопределенности u u d DW d 4 – автокорреляция отсутствует l u d DW d 4 4 – зона неопределенности 4 4 DW d l – отрицательная автокорреляция, принимается * 1 Н Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, тона практике предполагают существование автокорреляции остатков и отклоняют гипотезу Можно показать, что статистика DW тесно связана с коэффициентом автокорреляции первого порядка n i i n i i n i i i i i e e e e r 2 2 1 1 1 2 2 Связь выражается формулой 1 , 1 2 i Значения r изменяются отв случае отрицательной автокорреляции) до +1 (в случае положительной автокорреляции). Близость r к нулю свидетельствует об отсутствии автокорре- ляции. При отсутствии таблиц критических значений DW можно использовать следующее грубое правило при достаточном числе наблюдений (12-15), при 1-3 объясняющих переменных, если 5 , 2 5 , 1 DW , то отклонения от линии регрессии можно считать взаимно независимыми. Либо применить к данным уменьшающее автокорреляцию преобразование (например автокорреляционное преобразование или метод скользящих средних. Существует несколько ограничений на применение критерия Дарбина-Уотсона. 1. Критерий DW применяется лишь для тех моделей, которые содержат свободный член. 2. Предполагается, что случайные отклонения определяются по итерационной схеме i i i v e e 1 , называемой авторегрессионной схемой первого порядка AR(1). Здесь i – случайный член. 3. Статистические данные должны иметь одинаковую периодичность (не должно быть пропусков в наблюдениях. 4. Критерий Дарбина – Уотсона неприменим к авторегрессионным моделям, которые содержат в числе факторов также зависимую переменную с временным лагом (запаздыванием) в один период. Для авторегрессионных моделей предлагается h – статистика Дарбина l d 4 4 u d Положительная автокорреляция Отрицательная автокорреляция Отсутствие автокорреляции ? ? 0 D W 2 u d 4 Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 38 c nD n h 1 ˆ , где ˆ – оценка коэффициента автокорреляции первого порядка, D(c) – выборочная дисперсия коэффициента при лаговой переменной y t-1 , n – число наблюдений. Обычно значение ˆ рассчитывается по формуле 2 / 1 ˆ DW , а D(c) равна квадрату стандартной ошибки S c оценки коэффициента с. Методы устранения автокорреляции. Авторегрессионное преобразование В случае наличия автокорреляции остатков полученная формула регрессии обычно считается неудовлетворительной. Автокорреляция ошибок первого порядка говорит о неверной спецификации модели. Поэтому следует попытаться скорректировать саму модель. Посмотрев на график ошибок, можно поискать другую (нелинейную) формулу зависимости, включить неучтённые до этого факторы, уточнить период проведения расчётов или разбить его на части. Если все эти способы не помогают и автокорреляция вызвана какими–то внутренними свойствами ряда {e i }, можно воспользоваться преобразованием, которое называется авторегресси- онной схемой первого порядка AR(1). (Авторегрессией это преобазование называется потому, что значение ошибки i e определяется значением той же самой величины, нос запаздыванием. Т.к. максимальное запаздывание равно 1, то это авторегрессия первого порядка. Формула AR(1) имеет вид . i i i v Где 1 . i коэффициент автокорреляции первого порядка ошибок регрессии. Рассмотрим AR(1) на примере парной регрессии e bx Тогда соседним наблюдениям соответствует формула i i i e bx a y (1), 1 1 1 i i i e bx a y (2). Умножим (2) на и вычтем из (1): 1 1 1 1 i i i i i i e e x x b a y Сделаем замены переменных ) 5 ( 1 ) 4 ( ; ) 3 ( ; * 1 * 1 * a a x x x y y y i i i i i получим с учетом i i i v e e 1 : i i i v bx a y * * * (6). Это преобразование называется авторегрессионным (преобразованием Бокса-Дженкинса). Поскольку случайные отклонения i удовлетворяют предпосылкам МНК, оценки аи будут обладать свойствами наилучших линейных несмещенных оценок. По преобразованным значениям всех переменных с помощью обычного МНК вычисляются оценки параметров аи, которые затем можно использовать в регрессии. То. если остатки по исходному уравнению регрессии автокоррелированы, то для оценки параметров уравнения используют следующие преобразования 1) Преобразовать исходные переменные у их к виду (3), (4). 2) Обычным МНК для уравнения (6) определить оценки аи) Рассчитать параметра исходного уравнения из соотношения (а а) Записать исходное уравнение (1) с параметрами аи (где а - из па берётся непосредственно из уравнения (6)). Авторегрессионное преобразование может быть обобщено на произвольное число объясняющих переменных, те. использовано для уравнения множественной регрессии. Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 39 Для преобразования AR(1) важно оценить коэффициент автокорреляции ρ. Это делается несколькими способами. Самое простое – оценить ρ на основе статистики DW: 2 / 1 1 , DW r i i , где r берется в качестве оценки ρ. Этот метод хорошо работает при большом числе наблюдений. В случае, когда есть основания считать, что положительная автокорреляция отклонений очень велика ( 1 , 0 1 , i i r DW ), можно использовать метод первых разностей (метод исключения тенденции, уравнение принимает вид 1 1 1 i i i i i i e e x x b y y 1 * 1 * ; i i i i i i x x x y y y i i i v bx Из уравнения по МНК оценивается коэффициент b. Параметра здесь не определяется непосредственно, однако из МНК известно, что x b В случае полной отрицательной автокорреляции отклонений ( 1 1 , i i r ) a a x x x y y y i i i i i i 2 ; ; * 1 * 1 * , получаем уравнение регрессии i i i i i v x x b a y y 1 или i i i i i v x x b a y y 2 2 1 Вычисляются средние за 2 периода, а затем по ним рассчитывают аи. Данная модель называется моделью регрессии по скользящим средним. Проверка гомоскедастичности дисперсии ошибок В соответствии с четвёртой предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора j x остатки е имеют одинаковую дисперсию 2 . Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. В качестве примера реальной гетероскедастичности можно привести то, что люди с большим доходом не только тратят в среднем больше, чем люди с меньшим доходом, но и разброс в их потреблении также больше, поскольку они имеют больше простора для распределения дохода. Наличие гетероскедастичности можно наглядно видеть из поля корреляции (- графический метод обнаружения гетероскедастичности). а) – дисперсия остатков растет по мере увеличения x ; б) – дисперсия остатков достигает максимальной величины при средних значениях переменной и уменьшается при минимальных и максимальных значениях x ; в) – максимальная дисперсия остатков при малых значениях и дисперсия остатков однородна по мере увеличения значений x Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 40 Наличие гомоскедастичности или гетероскедастичности можно видеть и по рассмотренному выше графику зависимости остатков е от теоретических значений результативного признака а) Гетероскедастичность: большая дисперсия е для больших значений x y (соответствует полю корреляции (а. б) Гетероскедастичность, соответствующая полю корреляции на рис. б. в) Гетероскедастичность, соответствующая полю корреляции на рис. в. Для множественной регрессии данный вид графиков является наиболее приемлемым визуальным способом изучения гомо- и гетероскедастичности. При нарушении гомоскедастичности имеем неравенства ) ( 2 2 2 j i j i e e , где 2 - постоянная дисперсия ошибки при соблюдении предпосылки. Те. можно записать, что дисперсия ошибки прим наблюдении пропорциональна постоянной дисперсии 2 2 i e K i К - коэффициент пропорциональности. Он меняется при переходе от одного значения фактора j x к другому. Задача состоит в том, чтобы определить величину К и внести поправку в исходные переменные. При этом используют обобщённый МНК, который эквивалентен обычному МНК, применённому к преобразованным данным. Чтобы убедиться в обоснованности использования обобщённого МНК проводят эмпирическое подтверждение наличия гетероскедастичности. При малом объёме выборки, что наиболее характерно для эмпирических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта (в 1965 гони рассмотрели модель парной линейной регрессии, в которой дисперсия ошибок пропорциональна квадрату фактора. Пусть рассматривается модель, в которой дисперсия е пропорциональна квадрату фактора. А также остатки имеют нормальное распределение и отсутствует автокорреляция остатков. Параметрический тест (критерий) Гольдфельда – Квандта: 1. Все n наблюдений в выборке упорядочиваются по величине x. 2. Вся упорядоченная выборка разбивается натри подвыборки (объёмом k, С, k.) 2 2 C n k k п С Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 41 Исключаются из рассмотрения С центральных наблюдений. (По рекомендациям специалистов, объём исключаемых данных С должен быть примерно равен четверти общего объёма выборки n, в частности, при n =20, С при n =30, С = 8; при n =60, С. 3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для последней подвыборки (k последних наблюдений. 4. Определяются остаточные суммы квадратов k i i e S 1 2 1 для первой и второй групп. Если предположение о пропорциональности дисперсий отклонений значениям x верно, то 1 2 S S 5. Выдвигается нулевая гипотеза |