статис.. Статистические методы прогнозирования в экономике_Дуброва, Архип. Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики
Скачать 1.1 Mb.
|
ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 4.1. Доверительные интервалы прогноза Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упре- ждения. Полученный таким образом прогноз называют точечным, так как для каждого мо- мента времени определяется только одно значение прогнозируемого показателя. На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать «вилку» возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный. Несовпадение фактических данных с точечным прогнозом, полученным путем экс- траполяции тенденции по кривым роста, может быть вызвано: 1) субъективной ошибочностью выбора вида кривой; 2) погрешностью оценивания параметров кривых; 3) погрешностью, связанной с отклонением отдельных наблюдений от тренда, ха- рактеризующего некоторый средний уровень ряда на каждый момент времени. Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неоп- ределенность, связанную с положением тренда, и возможность отклонения от этого трен- да, определяется в виде: p a L n S t y ± + € , (4.1) где n — длина временного ряда; L — период упреждения; L n y + € — точечный прогноз на момент n + L; α t — значение t-статистики Стьюдента; S p — средняя квадратическая ошибка прогноза. Предположим, что тренд может быть описан линейной моделью: t a a y t 1 0 + = ) Так как оценки параметров определяются по выборочной совокупности, представ- ленной временным рядом, то они содержат погрешность. Погрешность параметра a 0 при- водит к вертикальному сдвигу прямой, погрешность параметра a 1 — к изменению угла на- клона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций отно- сительно линий тренда, дисперсию 2 p S можно представить в виде: 2 1 2 2 1 2 2 2 ) ( ) ( y n t y y p S t t t t S n S S + − − + = ∑ = , (4.2) где 2 y S — дисперсия отклонений фактических наблюдений от расчетных; t l — время упреждения, для которого делается экстраполяция; t l = n + L ; ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 40 t — порядковый номер уровней ряда, t = 1, 2, ..., n; t — порядковый номер уровня, стоящего в середине ряда; t = (n + 1) : 2 Тогда доверительный интервал можно представить в виде: ∑ = + − − + + ± n t y a L n t t t t n n S t y 1 2 2 1 ) ( ) ( 1 € . (4.3) Обозначим корень в выражении (4.3) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К* = t α K. Тогда интервальная оценка будет иметь вид: ∗ + ± K S y y L n € (4.4) Выражение, аналогичное (4.3), можно получить для полинома второго порядка: 2 2 4 4 1 2 1 2 4 2 2 1 ) ( ) 2 ( 1 € ∑ ∑ ∑ ∑ ∑ − + − + + ± + t t n nt t t t t t S t y y a L n (4.5) или ∗ + ± K S y y L n € (4.6) Дисперсия отклонений фактических наблюдений от расчетных определяется выра- жением: , ) € ( 1 2 2 k n y y S n t t t y − − = ∑ = (4.7) где y t — фактические значения уровней ряда; t y€ — расчетные значения уровней ряда; n — длина временного ряда; k — число оцениваемых параметров выравнивающей кривой. Таким образом, ширина доверительного интервала зависит от уровня значимо- сти, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения. Доверительные интервалы прогнозов, полученных с использованием показатель- ной модели, определяют аналогичным образом. Отличие состоит в том, что как при вы- числении параметров кривой, так и при вычислении средней квадратической ошибки ис- пользуют не сами значения уровней временного ряда, а их логарифмы. ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 41 t а а y t 1 0 + = ) Рис. 4.1. Доверительные интервалы прогноза для линейного тренда Таблица 4.1. [3] Значения К* для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 Линейный тренд Параболический тренд Период упреждения (L) Период упреждения (L) Длина временного ряда (n) 1 2 3 Длина временного ряда (n) 1 2 3 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2,6380 2,8748 3,1399 2,4631 2,6391 2,8361 2,3422 2,4786 2,6310 2,2524 2,3614 2,4827 2,1827 2,2718 2,3706 2,1274 2,2017 2,2836 2,0837 2,1463 2,2155 2,0462 2,1000 2,1590 2,0153 2,0621 2,1131 1,9883 2,0292 2,0735 1,9654 2,0015 2,0406 1,9455 1,9776 2,0124 1,9280 1,9568 1,9877 1,9117 1,9375 1,9654 1,8975 1,9210 1,9461 1,8854 1,9066 1,9294 1,8738 1,8932 1,9140 1,8631 1,8808 1,8998 1,8538 1,8701 1,8876 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 3,948 5,755 8,152 3,459 4,754 6,461 3,144 4,124 5,408 2,926 3,695 4,698 2,763 3,384 4,189 2,636 3,148 3,808 2,536 2,965 3,516 2,455 2,830 3,286 2,386 2,701 3,100 2,330 2,604 2,950 2,280 2,521 2,823 2,238 2,451 2,717 2,201 2,391 2,627 2,169 2,339 2,549 2,139 2,293 2,481 2,113 2,252 2,422 2,090 2,217 2,371 2,069 2,185 2,325 2,049 2,156 2,284 По такой же схеме могут быть определены доверительные интервалы для ряда кри- вых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты). В таблице 4.1. приведены значения K* в зависимости от длины временного ряда n и периода упреждения L для линейной модели и параболической модели тренда. Очевидно, ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 42 что при увеличении длины рядов (n) значения K* уменьшаются, с ростом периода упреж- дения L значения K* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n: чем больше длина ряда, тем меньшее влияние оказывает пери- од упреждения L. 4.2. Проверка адекватности выбранных моделей Проверка адекватности выбранных моделей реальному процессу (в частности, аде- кватности полученной кривой роста) строится на анализе остаточной компоненты. Оста- точная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во времен- ном ряду). Предположим, что исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда, содержащей трендовую и случайную компоненты. Тогда ряд остатков будет получен как отклонения фактических уровней временно- го ряда (y t ) от расчетных ( t y€ ): t t t y y e € − = (4.8) При использовании кривых роста t y€ вычисляют, подставляя в уравнения выбран- ных кривых соответствующие последовательные значения времени. Принято считать, что модель адекватна описываемому процессу, если остаточная последовательность (ряд остатков) представляет собой случайную компоненту ряда. Поэтому при оценке «качества» модели проверяют, удовлетворяет ли остаточная последовательность следующим свойствам: • случайности колебаний уровней ряда; • соответствию распределения остаточной компоненты нормальному закону с нулевым математическим ожиданием; • независимости значений уровней ряда остатков между собой. При проверке первого свойства исследователю полезно провести графический ана- лиз остаточной последовательности, а также на этом этапе может быть использован стати- стический аппарат, обсуждаемый в параграфе 1.3. В современных эконометрических пакетах имеется набор графических средств, по- зволяющих судить о том, насколько распределение остатков согласуется с нормальным распределением. Например, полезным может оказаться график гистограммы остатков с наложенной нормальной плотностью, позволяющей исследователю оценить симметрич- ность распределения остатков и близость к нормальному закону. Кроме графических средств, в современных пакетах прикладных программ пред- ставлены и статистические критерии, позволяющие проводить проверку гипотезы о нор- мальности распределения остатков, например, критерий Пирсона и др. Однако на практи- ке использование этих средств зачастую затруднено из-за небольшой длины временных рядов экономических показателей (n < 50). Поэтому проверка на нормальность может быть произведена приближенно, например, на основе подхода, опирающегося на рассмот- рение показателей асимметрии и эксцесса. Как известно, при нормальном распределении показатели асимметрии и эксцесса равны нулю. Так как мы предполагаем, что отклонения от тренда представляют собой вы- борку из некоторой генеральной совокупности, то можно определить выборочные харак- ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 43 теристики асимметрии (А) и эксцесса (Э), а также оценить их среднеквадратические ошибки, зависящие от длины ряда n: . e n e n Э= e n e n A n t t n t t n t t n t t 3 1 1 ; 1 1 2 1 2 1 4 3 1 2 1 3 − = ∑ ∑ ∑ ∑ = = = = (4.9) Если одновременно выполняются следующие неравенства: ) 3 ( ) 1 ( ) 2 ( 6 5 , 1 + ⋅ + − ⋅ ⋅ < n n n А ; , ) 5 ( ) 3 ( ) 1 ( ) 3 )( 2 ( 24 5 , 1 1 6 2 + ⋅ + ⋅ + − − ⋅ ⋅ ⋅ < + + n n n n n n n Э (4.10) то гипотеза о нормальном характере распределения случайной компоненты не отвергается. Если выполняется хотя бы одно из неравенств: , ) 5 ( ) 3 ( ) 1 ( ) 3 ( ) 2 ( 24 2 1 + n 6 + Э ; ) 3 ( ) 1 ( ) 2 ( 6 2 2 + ⋅ + ⋅ + − ⋅ − ⋅ ⋅ ≥ + ⋅ + − ⋅ ≥ n n n n n n n n n A (4.11) то гипотеза о нормальном характере распределения отвергается. Другие случаи требуют дополнительной проверки с помощью более мощных критериев. Рассмотрим подробнее последнее свойство. Если вид функции, описывающей сис- тематическую составляющую, выбран неудачно, то последовательные значения ряда ос- татков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция остатков. Существует несколько приемов обнаружения автокорреляции. Наиболее распро- страненным является подход, опирающийся на критерий Дарбина-Уотсона. Тест Дарби- на-Уотсона связан с проверкой гипотезы об отсутствии автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. При этом критическая статистика определяется по формуле: ( ) ∑ ∑ = = − − = n t t n t t t e e e d 1 2 2 2 1 (4.12) ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 44 Можно показать, что величина d приближенно равна: ) 1 ( 2 1 r d − ≈ , (4.13) где r 1 — коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреля- ции между двумя последовательностями остатков e 1 , e 2 , ... ,e n–1 и e 2 , e 3 , ... , e n ). Из (4.13) видно, что близость значения статистики d к нулю означает наличие вы- сокой положительной автокорреляции (коэффициент 1 r близок к единице); близость зна- чения статистики d к четырем означает наличие высокой отрицательной автокорреляции (коэффициент 1 r близок к минус единице). Естественно, в случае отсутствия автокорреля- ции значение статистики d будет близким к двум (коэффициент 1 r не сильно отличается от нуля). Применение на практике критерия Дарбина-Уотсона основано на сравнении рас- четного значения статистики d с пороговыми, граничными значениями 1 d и 2 d Граничные значения 1 d и 2 d , зависящие от числа наблюдений n, количества объяс- няющих переменных в модели, уровня значимости α , находятся по таблицам (авторами критерия составлены таблицы для α = 0,05, α = 0,025 и α = 0,01). Фрагмент таблицы Дар- бина-Уотсона с критическими значениями 1 d и 2 d при 5% уровне значимости представ- лен ниже (см. табл. 4.2). Алгоритм выявления автокорреляции остатков на основе критерия Дарбина- Уотсона следующий. Выдвигается гипотеза 0 H об отсутствии автокорреляции остатков. Пусть альтерна- тивная гипотеза состоит в наличии в остатках положительной автокорреляции первого порядка. Тогда при сравнении расчетного значения статистики d ( d < 2) с 1 d и 2 d возможны следующие варианты. 1) Если d < 1 d , то гипотеза 0 H об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α ) в пользу гипотезы о положительной автокорреляции. 2) Если d > 2 d , то гипотеза 0 H не отвергается. 3) Если 2 1 d d d ≤ ≤ , то нельзя сделать определенный вывод по имеющимся исходным данным (значение d попало в область неопределенности). Если альтернативной является гипотеза о наличии в остатках отрицательной авто- корреляции первого порядка, то с пороговыми, граничными значениями 1 d и 2 d сравни- вается величина d − 4 (при d >2). При этом возможны следующие варианты. 1) Если d − 4 < 1 d , то гипотеза 0 H об отсутствии автокорреляции отвергается (с вероятно- стью ошибки, равной α ) в пользу гипотезы об отрицательной автокорреляции. 2) Если d − 4 > 2 d , то гипотеза 0 H не отвергается. 3) Если 2 1 4 d d d ≤ − ≤ , то нельзя сделать определенный вывод по имеющимся исходным данным. ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 45 Таблица 4.2 Значения d 1 и d 2 критерия Дарбина-Уотсона при 5% уровне значимости (n — длина временного ряда, k′ — число объясняющих переменных в модели) K′ = 1 K′ = 2 K′ = 3 n d 1 d 2 d 1 d 2 d 1 d 2 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 1,08 1,1 1,13 1,16 1,18 1,2 1,22 1,”4 1,26 1,27 1,29 1,3 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,49 1,4 1,41 1,36 1,37 1,38 1,39 1,4 1,41 1,42 1,43 1,44 1,45 1,45 1,46 1,47 1,48 1,48 1,49 1,5 1,5 1,51 1,51 1,52 1,52 0,95 0,98 1,02 1,05 1,08 1,1 1,13 1,15 1,17 1,19 1,21 1,22 1,24 1,26 1,27 1,28 1,3 1,31 1,32 1,33 1,34 1,35 1,54 1,54 1,54 1,53 1,53 1,54 1,54 1,54 1,54 1,55 1,55 1,55 1,56 1,56 1,56 1,57 1,57 1,57 1,58 1,58 1,58 1,59 0,82 0,86 0,9 0,93 0,97 1 1,03 1,05 1,08 1,1 1,12 1,14 1,16 1,18 1,2 1,21 1,23 1,24 1,26 1,27 1,28 1,29 1,75 1,73 1,71 1,69 1,68 1,68 1,67 1,66 1,66 1,66 1,66 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,65 Данный критерий нельзя использовать, если среди объясняющих переменных со- держатся лагированные значения результативного показателя (например, он не применим к моделям авторегрессии). Таким образом, можно считать, что в случае отсутствия автокорреляции в остатках расчетное значение статистики (4.12) «не слишком отличается» от 2. 4.3. Характеристики точности моделей Важнейшими характеристиками качества модели, выбранной для прогнозирования, являются показатели ее точности. Они описывают величины случайных ошибок, полу- ченных при использовании модели. Таким образом, чтобы судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адек- ватность модели, так и ее точность. О точности прогноза можно судить по величине ошибки (погрешности) прогноза. Ошибка прогноза — величина, характеризующая расхождение между фактическим и прогнозным значением показателя. ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 46 Абсолютная ошибка прогноза определяется по формуле: t t t y y − = ∆ ) , (4.14) где t y) — прогнозное значение показателя; t y — фактическое значение. Эта характеристика имеет ту же размерность, что и прогнозируемый показатель, и зависит от масштаба измерения уровней временного ряда. На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя: % 100 ⋅ − = t t t t y y y) δ . (4.15) Также используются средние ошибки по модулю (абсолютные и относительные): %, 100 1 ; 1 1 ⋅ − = − = ∆ ∑ ∑ = = n t t t t n t t t y y y n n y y ) ) δ (4.16) где n — число уровней временного ряда, для которых определялось прогнозное значение. Из (4.14), (4.15) видно, что если абсолютная и относительная ошибка больше 0, то это свидетельствует о «завышенной» прогнозной оценке, если меньше 0, то прогнозное значение было занижено. Очевидно, что все указанные характеристики могут быть вычислены после того, как период упреждения уже закончился, и имеются фактические данные о прогнозируемом по- казателе или при рассмотрении показателя на ретроспективном участке. В последнем случае имеющаяся информация делится на две части: по первой — оцениваются параметры модели, а данные второй части рассматриваются в качестве фак- тических. Ошибки прогнозов, полученные ретроспективно (на втором участке) характери- зуют точность применяемой модели. На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия (S 2 ) или среднеквадратическая ошибка (S): ( ) . S S= n y y S n t t t 2 1 2 2 ; ∑ = − = ) (4.17) Чем меньше значения этих характеристик, тем выше точность модели. На практи- ке часто в качестве знаменателя в формуле для дисперсии принимают величину (n – k), где k — число оцениваемых коэффициентов модели. О точности модели нельзя судить по одному значению ошибки прогноза. Напри- мер, если прогнозная оценка месячного уровня производства в июне совпала с фактиче- ским значением, то это не является достаточным доказательством высокой точности мо- дели. Надо учитывать, что единичный хороший прогноз может быть получен и по плохой модели, и наоборот. ГЛАВА 4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА. ОЦЕНКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛЕЙ 47 Следовательно, о качестве применяемых моделей можно судить лишь по сово- купности сопоставлений прогнозных значений с фактическими. Простой мерой качества прогнозов может стать µ — относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом: q p p + = µ , (4.18) где р — число прогнозов, подтвержденных фактическими данными; q — число прогнозов, не подтвержденных фактическими данными. Когда все прогнозы подтверждаются, то q = 0 и µ = 1. Если же все прогнозы не подтвердились, то р = 0 и µ = 0. Отметим, что сопоставление коэффициентов µ для разных моделей может иметь смысл при условии, что доверительные вероятности приняты одинаковыми. |