Эконометрика, лекции. 1 Составитель Е. А. Парышева Введение
Скачать 1.28 Mb.
|
r 2 2 2 2 1 2 1 2 2 1 1 1 , ) ( ) ( ) )( ( (3) y t t 0 y t 0 y t t 0 Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 73 где в качестве средних величин берутся значения ; 1 2 1 n y y n t t 1 2 1 2 n y y n t t (4) В первом случае усредняются значения ряда, начиная со второго до последнего, во втором случае – значения ряда с первого до предпоследнего. Формулу (3) можно представить как формулу выборочного коэффициента корреляции , ) ( ) ( ) )( ( 2 2 y y x x y y x x r i i i i xy (5) где в качестве переменной х берется ряд , ,..., , 3 2 n у у у а в качестве переменной у ряд ,..., , 1 2 1 n у у у Если значение коэффициента (3) близко к единице, это указывает на очень тесную зависимость между соседними уровнями временного ряда и о наличии во временном ряде сильной линейной тенденции. Аналогично определяются коэффициенты автокорреляции более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями t y и 2 t y и определяется по формуле n t n t t t n t t t y y y y y y y y r 3 2 2 4 2 2 3 3 4 2 3 2 , ) ( ) ( ) )( ( (6) где в качестве одной средней величины берут среднюю уровней ряда с третьего до последнего, а в качестве другой – среднюю с первого уровня до : 2 n y ; 2 3 3 n y y n t t 2 3 2 4 n y y n t t (7) Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокор- реляции, уменьшается. Для обеспечения статистической достоверности максимальный лаг, как считают некоторые известные эконометристы, не должен превышать четверти общего объема выборки. Коэффициент автокорреляции строится по аналогии с линейным коэффициентом корреляции, и поэтому он характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. По нему можно судить о наличии линейной или близкой к линейной тенденции. Однако для некоторых временных рядов с сильной нелинейной тенденцией (например, параболической или экспоненциальной, коэффициент автокорреляции уровней ряда может приближаться к нулю. Кроме того, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных имеют положительную автокорреляцию уровней, однако при этом не исключается убывающая тенденция. Последовательность коэффициентов автокорреляции уровней различных порядков, начиная с первого, называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага называется коррелограммой. Анализ автокорреляционной функции и коррелограммы помогает выявить структуру ряда. Здесь уместно привести следующие качественные рассуждения. Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 74 0,0 2,0 4,0 6,0 8,0 10,0 12,0 0 4 8 12 16 t Если наиболее высоким является коэффициент автокорреляции первого порядка, очевидно, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка τ, ряд содержит циклические колебания с периодичностью в τ моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то либо ряд не содержит тенденции и циклических колебаний и имеет только случайную составляющую, либо ряд содержит сильную нелинейную тенденцию, для исследования которой нужно провести дополнительный анализ. Пример 1. Пусть имеются данные об объёмах потребления электроэнергии жителями района за 16 кварталов, млн. квт.-ч: t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 y t 6,0 4,4 5,0 9,0 7,2 4,8 6,0 10,0 8,0 5,6 6,4 11,0 9,0 6,6 7,0 10,8 Нанесем эти значения на график Определим автокорреляционную функцию данного временного ряда. Рассчитаем коэффициент автокорреляции первого порядка. Для этого определим средние значения 0667 , 7 15 0 , 7 0 , 5 4 , 4 0 , 6 ; 3867 , 7 15 8 , 10 0 , 9 0 , 5 4 , 4 2 1 y С учетом этих значений можно построить вспомогательную таблицу t y t 1 y y t 2 y y t 2 1 1 y y y y t t 2 1 y y t 2 1 y y t 1 6,0 -1,0667 1,137778 2 4,4 -2,9867 -2,6667 3,185778 8,920178 7,111111 3 5,0 -2,3867 -2,0667 6,364444 5,696178 4,271111 4 9,0 1,6133 1,9333 -3,33422 2,602844 3,737778 5 7,2 -0,1867 0,1333 -0,36089 0,034844 0,017778 6 4,8 -2,5867 -2,2667 -0,34489 6,690844 5,137778 7 6,0 -1,3867 -1,0667 3,143111 1,922844 1,137778 8 10,0 2,6133 2,9333 -2,78756 6,829511 8,604444 9 8,0 0,6133 0,9333 1,799111 0,376178 0,871111 10 5,6 -1,7867 -1,4667 -1,66756 3,192178 2,151111 11 6,4 -0,9867 -0,6667 1,447111 0,973511 0,444444 12 11,0 3,6133 3,9333 -2,40889 13,05618 15,47111 13 9,0 1,6133 1,9333 6,345778 2,602844 3,737778 14 6,6 -0,7867 -0,4667 -1,52089 0,618844 0,217778 15 7,0 -0,3867 -0,0667 0,180444 0,149511 0,004444 16 10,8 3,4133 -0,22756 11,65084 Итого 9,813333 65,3173 54,0533 Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 75 С помощью итоговых сумм подсчитаем величину коэффициента автокорреляции первого порядка 165154 , 0 Это значение свидетельствует о слабой зависимости текущих уровней ряда от непосредственно им предшествующих. Однако из графика очевидно наличие возрастающей тенденции уровней ряда, на которую накладываются циклические колебания. Продолжая аналогичные расчеты для второго, третьего и т.д. порядков, получим автокорреляционную функцию, значения которой сведем в таблицу и построим по ней коррелограмму: Лаг 1 2 3 4 5 6 7 8 t r 0,16515 0,56687 0,11355 0,98302 0,11871 0,72204 0,00336 0,97384 Из коррелограммы видно, что наиболее высокий коэффициент корреляции наблюдается при значении лага, равном четырем, следовательно, ряд имеет циклические колебания периодичностью в четыре квартала. Это подтверждается и графическим анализом структуры ряда. В случае если при анализе структуры временного ряда обнаружена только тенденция и отсутствуют циклические колебания (случайная составляющая присутствует всегда, следует приступать к моделированию тенденции. Если же во временном ряде имеют место и циклические колебания, прежде всего, следует исключить именно циклическую составляющую, и лишь затем приступать к моделированию тенденции. Выявление тенденции состоит в построении аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда. Зависимость от времени может принимать разные формы, поэтому для её формализации используют различные виды функций - линейный тренд: t b a y t ˆ ; - гипербола t b a y t / ˆ ; - экспоненциальный тренд: t b a t e y ˆ (или t t b a y ˆ ); - степенной тренд: b t t a y ˆ ; - параболический тренд второго и более высоких порядков k k t t b t b t b a y ˆ 2 Параметры каждого из трендов можно определить обычным МНК, используя в качестве независимой переменной время n t ,..., 2 , 1 , а в качестве зависимой переменной – фактические уровни временного ряда y t (или уровни за вычетом циклической составляющей, если таковая была обнаружена. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации. Существует несколько способов определения типа тенденции. Чаще всего используют качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же це- 0 0,2 0,4 0,6 0,8 1 1,2 1 2 3 4 5 6 7 8 Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 76 лях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходными преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни y t и y t-1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция визу- чаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов. Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации 2 R и выбора уравнения тренда с максимальным значением этого коэффициента. Реализация этого метода относительно проста при компьютерной обработке данных. При анализе временных рядов, содержащих сезонные или циклические колебания, наиболее простым подходом является расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временнóго ряда в форме (1) или (2). Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель (1), в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель (2), которая ставит уровни ряда в зависимость от значений сезонной компоненты. Построение модели (1) или (2) сводится к расчету значений Т, S или Е для каждого уровня ряда. Процесс построения модели включает в себя следующие шаги 1. Выравнивание исходного ряда методом скользящей средней. 2. Расчет значений сезонной компоненты S. 3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (ТЕ) в аддитивной или (ТЕ) в мультипликативной модели. 4. Аналитическое выравнивание уровней (ТЕ) или (ТЕ) и расчет значений Т с использованием полученного уравнения тренда. 5. Расчет полученных по модели значений (Т) или (Т) 6. Расчет абсолютных и относительных ошибок. Пример 2. Построение аддитивной модели временного ряда. Рассмотрим данные об объёме потребления электроэнергии жителями района из ранее приведенного примера. Из анализа автокорреляционной функции было показано, что данный временнóй ряд содержит сезонные колебания периодичностью в 4 квартала. Объёмы потребления электроэнергии в осенне – зимний период (I и IV кварталы) выше, чем весной и летом (II и III кварталы. По графику этого ряда можно установить наличие приблизительно равной амплитуды колебаний. Это говорит о возможном наличии аддитивной модели. Рассчитаем её компоненты. Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Поскольку циклические колебания имеют периодичность в 4 квартала, просуммируем уровни ряда последовательно за каждые 4 квартала со сдвигом на один момент времени и определим условные годовые объёмы потребления электроэнергии (колонка 3 в таблице 1). Разделив полученные суммы на 4, найдем скользящие средние (колонка 4 таблицы 1). Полученные таким образом выровненные значения уже не содержат сезонной компоненты. Поскольку скользящие средние получены осреднением четырех соседних уровней ряда, те. четного числа значений, они соответствуют серединам подынтервалов, состоящих из четверок чисел, те. должны располагаться между третьими четвертым значениями четверок исходного ряда. Для того, чтобы скользящие средние располагались на одних временных отметках с исходным рядом, пары соседних скользящих средних ещё раз усредняются и получаются центрированные скользящие средние (колонка 5 таблицы 1). При этом теряются первые две и последние две отметки временного ряда, что связано с осреднением по четырем точкам. Таблица 1 № квартала Потребление электроэнергии Итого за четыре квартала Скользящая средняя за четыре квартала Центрированная скользящая средняя Оценка сезонной компоненты 1 2 3 4 5 6 1 6,0 2 4,4 3 5,0 24,4 6,10 6,25 -1,250 4 9,0 25,6 6,40 6,45 2,550 5 7,2 26,0 6,50 6,625 0,575 6 4,8 27,0 6,75 6,875 -2,075 7 6,0 28,0 7,00 7,1 -1,100 8 10,0 28,8 7,20 7,3 2,700 9 8,0 29,6 7,40 7,45 0,550 10 5,6 30,0 7,50 7,625 -2,025 11 6,4 31,0 7,75 7,875 -1,475 12 11,0 32,0 8,00 8,125 2,875 13 9,0 33,0 8,25 8,325 0,675 14 6,6 33,6 8,40 8,375 -1,775 15 7,0 33,4 8,35 16 10,8 Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда (колонка 2 таблицы 1) и центрированными скользящими средними (колонка 5). Эти значения помещаем в колонку 6 таблицы 1 и используем для расчета значений сезонной компоненты (таблица 2), которые представляют собой средние за каждый квартал (по всем годам) оценки сезонной компоненты S i . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период (в данном случае – за год) взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем точкам здесь – по четырем кварталам) должна быть равна нулю. Таблица 2 № квартала, i Показатели Год I II III IV 1 - - -1,250 2,550 2 0,575 -2,075 -1,100 2,700 3 0,550 -2,025 -1,475 2,875 4 0,675 -1,775 - - Итого за й квартал (за все годы) 1,800 -5,875 -3,825 8,125 Средняя оценка сезонной компоненты для го квартала, i S 0,600 -1,958 -1,275 2,708 Скорректированная сезонная компонента Для данной модели сумма средних оценок сезонной компоненты равна 0,6-1,958-1,275+2,708=0,075. Эта сумма оказалась неравной нулю, поэтому каждую оценку уменьшим на величину поправки, равной одной четверти полученного значения Δ=0,075/4=0,01875. Рассчитаем скорректированные значения сезонной компоненты (они записаны в последней строке таблицы 2): 4 , 1 , i S S i i (8) Эти значения при суммировании уже равны нулю 0,581-1,977-1,294+2,69=0. Шаг 3. Исключаем влияние сезонной компоненты, вычитая её значения из каждого уровня исходного временного ряда. Получаем величины T+E=Y-S (9) Эти значения рассчитываются в каждый момент времени и содержат только тенденцию и случайную компоненту (колонка 4 следующей таблицы Таблица 3 t t y t S i t S y E T T T+S ) ( S T y E t E 2 1 2 3 4 5 6 7 8 1 6,0 0,581 5,419 5,902 6,483 -0,483 0,2332 2 4,4 -1,977 6,377 6,088 4,111 0,289 0,0833 3 5,0 -1,294 6,294 6,275 4,981 0,019 0,0004 4 9,0 2,69 6,310 6,461 9,151 -0,151 0,0228 5 7,2 0,581 6,619 6,648 7,229 -0,029 0,0008 6 4,8 -1,977 6,777 6,834 4,857 -0,057 0,0032 7 6,0 -1,294 7,294 7,020 5,726 0,274 0,0749 8 10,0 2,69 7,310 7,207 9,897 0,103 0,0107 9 8,0 0,581 7,419 7,393 7,974 0,026 0,0007 10 5,6 -1,977 7,577 7,580 5,603 -0,003 0,0000 11 6,4 -1,294 7,694 7,766 6,472 -0,072 0,0052 12 11,0 2,69 8,310 7,952 10,642 0,358 0,1278 13 9,0 0,581 8,419 8,139 8,720 0,280 0,0785 14 6,6 -1,977 8,577 8,325 6,348 0,252 0,0634 15 7,0 -1,294 8,294 8,512 7,218 -0,218 0,0474 16 10,8 2,69 8,110 8,698 11,388 -0,588 0,3458 Шаг 4. Определим трендовую компоненту данной модели. Для этого проведем выравнивание ряда (ТЕ) с помощью линейного тренда: 91497 , 0 ; 186 , 0 715 , 5 Подставляя в это уравнение значения 16 ,..., 2 , 1 t , найдем уровни Т для каждого момента времени (колонка 5 таблицы 3). Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной компоненты для соответствующих кварталов, тек значениям в колонке 5 таблицы 3 прибавим значения в колонке 3. Результаты операции представлены в колонке 6 таблицы 3. Шаг 6. В соответствии с методикой построения аддитивной модели расчет ошибки производим по формуле ) ( S T Y E (10) Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only. 79 Это абсолютная ошибка. Численные значения абсолютных ошибок приведены в колонке 7 таблицы 3. По аналогии с моделью регрессии для оценки качества построения модели или для выбора наилучшей модели можно применять сумму квадратов полученных абсолютных ошибок. Для данной аддитивной модели сумма квадратов абсолютных ошибок равна 1,10. По отношению к общей сумме квадратов отклонений уровней ряда от его среднего уровня, равной 71,59, эта величина составляет чуть более 1,5%. Следовательно, можно сказать, что аддитивная модель объясняет общей вариации уровней временного ряда потребления электроэнергии за последние кварталов. Пример 3. Построение мультипликативной модели временного ряда. Пусть имеются поквартальные данные о прибыли компании за последние четыре года Таблица 4 Квартал Год I II II IV 1 72 100 90 64 2 70 92 80 58 3 62 80 68 48 4 52 60 50 30 График временного ряда свидетельствует о наличии сезонных колебаний периодичностью квартала и общей убывающей тенденции уровней ряда Прибыль компании в весенне-летний период выше, чем в осенне-зимний период. Поскольку амплитуда сезонных колебаний уменьшается, можно предположить существование мультипликативной модели. Определим её компоненты. Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Методика, применяемая на этом шаге, полностью совпадает с методикой аддитивной модели. Результаты расчетов оценок сезонной компоненты представлены в таблице |