Эконометрика в Excel (часть 2). Ю. Е. Воскобойников
Скачать 1.67 Mb.
|
Пример 2.3.2. Функция ( ) p τ задается формулой 2 ( ) 3sin 5 3.2 c ⎛ ⎞ = ⎜ ⎟ ⎝ ⎠ π τ τ , а значения временного ряда формируются как 2 0.1 0.4 0.5 ( ) ( ) i i i i i y p τ τ τ ε τ = + + + + , где ( 1) 0.1, 1,2, ,32 i i i τ = − ⋅ = … ; ( ) i ε τ – нормально распределен- ная величина с нулевым средним и дисперсией 2 0.11 σ = (что со- ответствует относительному уровню 0.10). Необходимо вычис- лить спектр ** k S временной выборки и выделить тригонометриче- скую составляющую. 78 Решение. Первоначально были получены значения i y при 0 δ = (т.е. отсутствует случайная составляющая ( ) i ε τ ) и по фор- мулам (2.3.7)–(2.3.9) вычислены коэффициенты * * * 0 , , k k a a b и опре- делен спектр * k S , значения которых отображены на рис. 2.18 (кривая 2). Затем были получены значения i y при 1 δ = (т.е. при- сутствует случайная составляющая ( ) i ε τ ), вычислены коэффици- енты ** ** ** 0 , , k k a a b и определен спектр ** k S , значения которых ото- бражены на рис. 2.18 (кривая 3). Анализ спектров, изображенных на рис. 2.18, позволяет сделать следующие выводы: • Спектры * ** , k k S S , вычисленные по значениям дискретного временного ряда, являются симметричными функциями относи- тельно точки / 2 16 k n = = • Во всех трех спектрах присутствует максимум, соответ- ствующий 5 k = , что говорит о наличии во временном ряду три- гонометрической составляющей вида ** ** 5 5 2 2 ( ) cos( 5 ) sin( 5 ) 3.2 3.2 c a b π π τ τ τ = + , где коэффициенты ** ** 5 5 0.119; 2.625 a b = − = , вычисленные по значениям дискретного временного ряда, приближенно равны ко- эффициентам, вычисленными по непрерывной функции (2.3.4) (см. пример 2.3.1). ☻ Таким образом, используя разложение временного ряда в ряд Фурье, удается достаточно точно выделить тригонометриче- скую составляющую временного ряда, «отфильтровав» тренд ( ) t τ (в нашем примере это полином второй степени 2 0.1 0.4 0.5 i i + + τ τ ) и случайную составляющую ( ) ε τ 2.3.3. Вычисление коэффициентов ряда Фурье в Excel В Excel вычислять коэффициенты разложения в ряд Фурье можно двумя способами: 79 • программированием в документе Excel формул (2.3.7)– (2.3.9); • используя режим Анализ Фурье модуля Анализ данных. Первый способ достаточно громоздок, и его можно реко- мендовать при сравнительно небольших объемах временной вы- борки с небольшим числом вычисляемых коэффициентов ряда Фурье. Пример 2.3.3. В табл. 2.4 приведены помесячные удои в Но- восибирской области в 1975, 1978, 1983 годах. Таблица 2.4 Помесячные надои по годам Месяц i τ 1975 1978 1983 Среднее i y 1 140 143 133 138.7 2 147 148 135 143.3 3 196 196 183 191.7 4 210 208 203 208.0 5 259 240 254 251.0 6 288 290 294 290.7 7 271 278 276 275.0 8 244 245 264 247.7 9 190 195 196 193.7 10 136 136 144 138.7 11 104 110 115 109.7 12 116 120 124 120.0 Среднее 191.8 192.4 192.6 192.2 В эту таблицу вошли данные только тех лет, которые харак- теризуются практически одинаковыми среднегодовыми удоями. Это означает, что отсутствует смещение, отличающее один год от другого, и имеют место только сезонные циклические колебания. В последнем столбце приведены средние значения месячных удо- ев, вычисленных по трем годам. Усреднение месячных надоев по 80 трем годам выполнено для уменьшения уровня случайной состав- ляющей ( ) ε τ временного ряда. Рассматривая i y как временную выборку ряда необходимо исследовать структуру сезонных циклических колебаний месяч- ных надоев молока. Решение. Занесем в документ Excel значения { } , i i y τ , 1,2,...,12 i = (рис. 2.19) и по этим данным построим график значе- ний i y временного ряда (рис. 2.20, кривая 1). Из графика виден колебательный характер изменения значений i y и поэтому для выяснения структуры этого временного ряда обратимся к мето- дам гармонического анализа (см. п. 2.3.1, 2.3.2). Рис. 2.19. Вычисление коэффициентов Фурье 81 Рис. 2.20. Значения i y и ( ) i p τ (пример 2.3.3) Коэффициенты ряда Фурье будем вычислять по формулам (2.3.7), (2.3.8), (2.3.9) при 12 T = , 1 τ Δ = , 12 n = . Тогда имеем следующие соотношения: 12 * 0 1 1 12 i i a y = = ∑ ; 12 * 1 1 cos 6 6 k i i k a y i π = ⎛ ⎞ = ⎜ ⎟ ⎝ ⎠ ∑ ; 12 * 1 1 sin 6 6 k i i k b y i π = ⎛ ⎞ = ⎜ ⎟ ⎝ ⎠ ∑ Вычислим коэффициенты 0 a , * k a , * 2 a , * 1 b , * 2 b , * * 6 2 n a a = . На рис. 2.19 показан фрагмент документа Excel, реализующий при- веденные выше формулы вычисления коэффициентов ряда Фу- рье. Здесь же приведены вычисленные значения коэффициентов, по которым определим: * *2 0 0 36998.5 S a = = ; * *2 *2 1 1 1 6912.7 S a b = + = ; * *2 *2 2 2 2 250.2 S a b = + = Видно, что первая гармоника вносит существенно больший энер- гетический вклад по сравнению со второй гармоникой 82 ( * * 1 2 27.6 S S ). Поэтому в качестве модели временного ряда при- мем первые три члена ряда Фурье, а именно, функцию ( ) * * * 0 1 1 2 2 cos sin 12 12 192.4 82.99cos 4.98sin 6 6 p a a b π π τ τ τ π π τ τ ⎛ ⎞ ⎛ ⎞ = + + = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ ⎛ ⎞ ⎛ ⎞ = − − ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ Вычисления этой функции показано на рис. 2.21. На рис. 2.20 приведен график этой функции и исходных значений i y . Видно достаточно хорошее совпадение i y и ( ) i p τ Об этом же говорит почти нулевое ( ) 14 1.18 10 − − ⋅ среднее значе- ние остатков ( ) i i y p τ − (столбец D на рис. 2.21). ☻ Рис. 2.21. Вычисление аппроксимирующей функции 83 Второй способ основан на дискретном преобразовании Фу- рье. Кратко остановимся на этом преобразовании. Пара дискретных преобразований, определяемая формулами: 2 1 0 ( ) ( ) jk N i N j Z k z j e π − − = = ∑ (прямое ДПФ); 2 1 0 1 ( ) ( ) jk N i N j z k Z j e N π − = = ∑ (обратное ДПФ), где 1 i = − − мнимая единица, называется дискретным преобра- зованием Фурье (ДПФ). Исходная дискретная последовательность ( ) z j является периодической (с периодом N). Последователь- ность ( ) Z k , называемая коэффициентами ДПФ также является периодической (с периодом N). Если коэффициенты ( ) Y k вычислены по значениям времен- ного ряда , 1, , j y j n = … , то связь между коэффициентами ДПФ и коэффициентами разложения в ряд определяется как: * 0 1 (0) a Y n = , * * 2 2 Re[ ( )], Im[ ( )], 1,..., / 2 k k a Y k b Y k k n n n = = = , где Re[ ] A , Im[ ] A означают вещественную и мнимую части ком- плексного числа А. Прямое и обратное ДПФ вычисляются в режиме Анализ Фу- рье . Для вызова этого режима необходимо обратиться к пункту Сервис команде Анализ данных и выбрать в списке режимов Анализ Фурье и щелкнуть мышью OK. Затем в новом диалоговом окне задать следующие параметры (рис. 2.22): Входной интервал: – диапазон ячеек, содержащих вещест- венные данные, к которым применяется ДПФ. Метки в первой строке – включается, если первая строка со- держит заголовки. Выходной интервал: – вводится адрес левой верхней ячейки выходного диапазона. Инверсия – включается, если необходимо вычислить обрат- ное ДПФ. 84 Замечание 2.3.1 . Используемый для вычисления ДПФ алго- ритм, называемый алгоритмом быстрого преобразования Фурье (БПФ) требует, чтобы n – число значений временного ряда, должно быть обязательно равным степени 2 (т.е. 8, 16, 32, 64, …), что является существенным ограничением. Один из путей пре- одоления этого недостатка – добавление в конец временной вы- борки нулей до тех пор, пока длина «новой» временной выборки не станет равной степени 2. Однако такой способ, применяемый при цифровой обработке сигналов, далеко не всегда пригоден для обработки данных, характеризующих экономические процессы. Поэтому перед применением режима Анализ Фурье необходимо сформировать выборку длиной n , равной степени числа 2. ♦ Рис. 2.22. Диалоговое окно режима Анализ Фурье Так как результатом работы режима Анализ Фурье будут комплексные числа вида k k a ib + , то для вычисления веществен- ной и мнимой части можно использовать следующие функции Excel (категория Инженерные): ВЕЩ(), МНИМ(). 85 2.4. Проверка адекватности и качества построенной модели временного ряда Проверка адекватности построенной модели реальному явле- нию или процессу является важным этапом прогнозирования ис- следуемых процессов. Исходными данными для такой проверки является ряд остатков (невязок) ( ) i i i e y q τ = − , 1, 2,..., i n = , (2.4.1) где ( ) i q τ – значение, вычисленное по построенной модели при i τ τ = . Заметим, что ( ) q τ может содержать не только тренд ( ) t τ , но и тригонометрическую составляющую. Проверка значимости трендовой составляющей рассматрива- лась с использованием F-критерия и индексов детерминации 2 t R , 2 t R в п. 2.1.3. Ниже будут рассмотрены способы проверки важных свойств и числовых характеристик ряда остатков. 2.4.1. Проверка математического ожидания ряда остатков Если трендовая составляющая ( ) t τ оценена достаточно точ- но и ( ) ( ) 0 i M ε τ ≡ , то математическое ожидание остатков ( ) i e τ должно быть равно нулю. Поэтому формулируем следующие ста- тистические гипотезы: 0 H : ( ) ( ) 0 i M e τ = ; (2.4.2) 1 H : ( ) ( ) 0 i M e τ ≠ , 1, 2,..., i n = . (2.4.3) Для проверки этих гипотез обратимся к критерию, приме- няемому в математической статистике, а именно, введем величину e e e T n s = ⋅ , (2.4.4) 86 где 1 1 n i i e e n = = ∑ ; ( ) 1 2 2 1 1 n i i e e e s n = ⎡ ⎤ − ⎢ ⎥ ⎢ ⎥ = − ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ∑ Если гипотеза 0 H справедлива, то критерий e T подчиняется рас- пределению Стьюдента с ( 1 n − ) степенями свободы. Поэтому критическая область при альтернативной гипотезе (2.4.3) имеет вид ( ) , 2 , 2 , , лев пр x x α α ⎤ ⎡ −∞ ∞ ⎦ ⎣ ∪ , (2.4.5) где , 2 , 2 лев пр x x α α = − , ( ) , 2 1 , 1 пр x t n α α = − − . (2.4.6) Значение ( ) 1 , 1 t n α − − можно вычислить, используя функцию Excel ( ) ( ) 1 , 1 РАСПСТЬЮДОБР ; 1 t n n α α − − = − . (2.4.7) Таким образом, если вычисленное значение критерия (2.4.4) попадает в критическую область (2.4.5), то гипотеза 0 H отверга- ется с уровнем значимости α и принимается гипотеза о том, что математические ожидания остатков отличаются от нуля. Это оз- начает, что выделенная неслучайная составляющая ( ) q τ содер- жит ненулевую систематическую (методическую) ошибку. Для устранения этой ошибки необходимо изменить уравнение тренда. 2.4.2. Проверка случайности ряда остатков При правильно подобранной модели неслучайной состав- ляющей временного ряда ряд остатков i e , 1, 2,..., i n = , должен представлять собой набор случайных величин. Для проверки свойства случайности значений i e воспользуемся критерием «по- воротных точек». Значение i e назовем поворотной точкой, если выполняется одно из следующих систем неравенств: 87 а) 1 i i e e − < ; 1 i i e e + < , б) 1 i i e e − > ; 1 i i e e + > Если остатки случайны, то одна поворотная точка будет прихо- диться примерно на 1,5 наблюдения. Обозначим через p n – фак- тическое количество поворотных точек в ряде остатков. Если вы- полняется неравенство ( ) 2 16 29 2 1.96 3 90 p n n ent n ⎡ ⎤ − > − − ⎢ ⎥ ⎣ ⎦ , (2.4.8) где [ ] ent ⋅ – целая часть, то ряд остатков i e можно считать слу- чайным и, следовательно, построенная модель не содержит сис- тематическую ошибку и является адекватной данному временно- му ряду. 2.4.3. Проверка независимости значений ряда остатков Зависимость между значениями ряда остатков (другими сло- вами наличие автокорреляции между этим значениями) также свидетельствует о неполноте построенной модели, в которой не была учтена автокорреляция между значениями исходного вре- менного ряда (более подробно об авторегрессионных моделях см. п. 4.1). Достаточно простым критерием, определяющим наличие ав- токорреляции между соседними наблюдениями, является сле- дующий тест. Тест Дарбина–Уотсона . Этот тест основан на простой идее: если корреляция между i ε и 1 i ε + не равна нулю, то она присутст- вует и в остатках (невязках) i i i e y y = − регрессионной модели, где ( ) i i y q τ = − оценка объясненной части временного ряда, по- строенная обычным методом наименьших квадратов. Определим статистику: 2 1 2 2 2 ( ) n i i i n i i e e d e − = = − = ∑ ∑ (2.4.9) 88 Между этой статистикой и выборочным коэффициентом корре- ляции r имеется связь: 2(1 ) d r ≈ − . (2.4.10) В случае отсутствия автокорреляции (т.е. 0 r ≈ ) значение стати- стики близко к двум. Близость статистики к нулю должна озна- чать наличие положительной автокорреляции, к четырем – отри- цательной автокорреляции. К сожалению, неопределена порого- вая точка для статистики d при принятии или отвержении нуле- вой гипотезы 0 H : автокорреляция отсутствует. Поэтому весь диапазон значений d делится на ряд интервалов. Если наблюда- ется значение: а) 4 B B d d d < < − – гипотеза 0 H принимается; б) H B d d d < < или 4 4 B H d d d − < < − – вопрос о принятии или отвержении гипотезы 0 H остается открытым; в) 0 H d d < < – гипотеза 0 H отвергается и принимается аль- тернативная гипотеза о положительной автокорреляции; г) 4 4 H d d − < < – гипотеза 0 H отвергается и принимается альтернативная гипотеза о наличии отрицательной автокорреля- ции. Пороговые значения , H B d d зависят от числа наблюдений, числа объясняющих переменных в функции ( ) q τ и уровня зна- чимости. Эти значения приводятся в специальной таблице [5] и определены для 15 n ≥ . Это ограничение является определенным недостатком теста. В табл. 2.5 приведены некоторые значения , H B d d для уровня значимости 0.05 α = , где k – число объяс- няющих переменных. Используя данные табл. 2.5, можно экстра- полировать , H B d d на меньшее число наблюдений. Пример 2.4.1. Выявить на уровне значимости 0.05 α = нали- чие автокорреляции ряда остатков уравнения тренда, построенно- го для временного ряда (значения приведены в табл. 2.1). 89 Решение. В качестве оценки ( ) q τ для неслучайной состав- ляющей ( ) q τ временного ряда возьмем квадратичный полином (см. пример 2.1.1) 2 ( ) 132.3 55.09 3.26 q τ τ τ = + − , что соответствует 2 k = (объясняющие переменные модели 2 , τ τ ). Вычислим остат- ки , 1,2, ,8 i e i = … и статистику d , как показано на фрагменте до- кумента Excel, приведенного на рис. 2.23. Таблица 2.5 1 k = 2 k = 3 k = 4 k = n H d B d H d B d H d B d H d B d 15 1.08 1.36 0.95 1.54 0.82 1.75 0.69 1.97 20 1.20 1.41 1.10 1.54 1.00 1.68 0.90 1.83 25 1.29 1.45 1.21 1.55 1.12 1.66 1.04 1.77 30 1.35 1.49 1.28 1.57 1.21 1.65 1.14 1.74 40 1.44 1.54 1.39 1.60 1.34 1.66 1.29 1.72 50 1.50 1.59 1.46 1.63 1.42 1.67 1.38 1.72 Рис. 2.23. Вычисление статистики Дарбина–Уотсона 90 Найденное значение 3.037 d = . Используя данные табл. 2.5, выполним линейную экстраполяцию значений , H B d d при 2 k = для числа наблюдений 8 n = . Получим 0.74, 1.54 H B d d ≈ ≈ . Вид- но, что вычисленное значение d находится в пределах от 1.54 B d = до 4 3.26 H d − = , что соответствует принятию гипотезы 0 H об отсутствии автокорреляции с уровнем значимости 0.05 α = . ☻ Положительные результаты описанных выше проверок свойств ряда остатков, а именно: • нулевое математическое ожидание остатков; • случайность значений ряда остатков; • независимость значений ряда остатков, дают уверенность в полноте и адекватности построенной модели и в успешном использовании модели для решения задач прогно- зирования временного ряда. 2.5. Прогнозирование трендовой составляющей временного ряда Идея социально-экономического прогнозирования базирует- ся на предположении, что закономерность развития, действовав- шая в прошлом (внутри ряда экономической динамики), сохра- нится и в прогнозируемом будущем. В этом смысле прогноз ос- нован на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективной, а в прошлое – ретроспективной. Прогнозирование метода экстраполяции базируется на сле- дующих предположениях: − развитие исследуемого явления в целом описывается плавной кривой; − общая тенденция развития явления в прошлом и настоя- щем не указывает на серьезные изменения в будущем; − учет случайности позволяет оценить вероятность откло- нения от закономерного развития. 91 Поэтому надежность и точность прогноза зависят от того, на- сколько близкими к действительности окажутся эти предположе- ния и насколько точно удалось охарактеризовать выявленную в прошлом закономерность. На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. ( ) 1 1 n n τ τ + = + Δ , ( ) 2 2 n n τ τ + = + Δ и т.д. Интервальные прогнозы строятся на основе точечных про- гнозов. Напомним, что доверительным называется интервал, от- носительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показа- теля. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений и выбран- ного пользователем доверительной вероятности. Нижняя ( ) H t l и верхняя ( ) B t l границы доверительного ин- тервала для «индивидуального» значения трендовой составляю- щей [5, с. 39–40] вычисляются по следующим формулам ( ) ( ) ( ) H l l l t t t τ τ δ τ = − ; (2.5.1) ( ) ( ) ( ) B l l l t t t τ τ δ τ = + , (2.5.2) где ( ) l t τ – значение оценки трендовой составляющей в момент времени l τ . Если l n τ τ > , то ( ) l t τ – прогнозируемое значение трендовой составляющей. Величина ( ) l f δ τ для линейного тренда ( ) 0 1 l t l b b τ = + (2.5.3) определяется выражением 92 ( ) ( ) ( ) ( ) 2 2 1 1 , 2 1 l l n f i i t n s n τ τ δ τ γ τ τ = − = − + + − ∑ , (2.5.4) где 2 1 2 n i i e s n = = − ∑ ; 1 1 n i i n τ τ = = ∑ (2.5.5) Напомним, что [5, с. 37–40]: • величина 2 s является оценкой для дисперсии 2 σ случайной составляющей временного ряда; • величина γ определяют доверительную вероятность (или надежность интервальной оценки) и обычно 0.95 γ = ; • ( ) , 2 t n γ − – квантиль распределения Стьюдента с ( 2 n − ) степенями свободы, определяемый функцией Excel: ( ) ( ) , 2 СТЬЮДРАСПОБР 1 ; 2 t n n γ γ − = − − (2.5.6) Для нелинейных моделей величина ( ) l f δ τ также зависит от s и разности l τ τ − , но эта зависимость имеет более сложный харак- тер. Если построенная модель адекватна, то с вероятностью γ можно утверждать, что при сохранении сложившихся закономер- ностей развития прогнозируемая величина попадает в интервал, образованный границами формул (2.5.1), (2.5.2). Пример 2.5.1. В табл. 2.6 приведены величины нетто- платежей ежемесячного финансирования инвестиционного про- екта. Таблица 2.6 Месяц 1 2 3 4 5 6 7 8 9 10 11 12 Платеж, тыс. р. 45 40 43 48 42 47 51 55 50 57 60 62 93 Требуется определить: • линейную модель зависимости объемов платежей от сро- ков (времени); • адекватность построенной модели; • размеры платежей на три последующих месяца, построив точечный и интервальный прогноз. Решение. Введем в столбцы А, В листа Excel данные табл. 2.6 (рис. 2.24), затем построим диаграмму рассеяния, как геометриче- ское место точек ( ) , i i y , 1,...,12 i = . Анализ диаграммы показывает наличие небольшого тренда. Используя команду Добавить линию тренда, строим линей- ную модель тренда, описываемую уравнением ( ) 38.23 1.81 t τ τ = + (2.5.7) с коэффициентом детерминации 2 0.823 R = . Для проверки значи- мости коэффициентов уравнения тренда обратимся к модулю Анализ данных режима Регрессия [5, с. 94–101] и зададим необ- ходимые параметры в появившемся диалоговом окне. Результаты выполнения режима Регрессия показаны на рис. 2.25, 2.26. Видно, что коэффициент детерминации равен 0.823, приве- денный коэффициент детерминации 2 0.805 R = (см. рис. 2.25). Все коэффициенты 0 b , 1 b являются значимыми (при уровне зна- чимости 0.05 α = ) и построенное уравнение линейного тренда также является значимым (см. рис. 2.25, 2.26), так как выполня- ются неравенства (более подробно см. [5, с. 41–46]): ( ) 0 19.554 1 , 2 2.228; b T t n α = > − − = ( ) 1 6.818 1 , 2 2.228; b T t n α = > − − = 1 ;1; 2 46.490 4.965 n F F α − − = > = 94 Рис. 2.24. Построение линейного тренда (пример 2.5.1) Рис. 2.25. Результаты выполнения режима Регрессия 95 Рис. 2.26. Результаты выполнения режима Регрессия Выполним проверку статистической гипотезы (2.4.2) о ра- венстве математического ожидания ряда остатков i e нулю, гра- фик которых приведен на рис. 2.27. Подставляя значения 0.002 e = ; ( ) 2 100.902 0.002 3.03 12 1 e s − = = − в выражение (2.4.4), получаем 0.002 12 0.0023 3.03 e T = = Рис. 2.27. График остатков i e 96 Используя функцию (2.4.6), вычисляем , 2 2.179 пр x α = . Видно, что вычисляемое значение критерия не попадает в критическую об- ласть (2.4.5) ( ] [ ) , 2.179 2.179, −∞ − ∪ ∞ , и поэтому принимается гипотеза о равенстве нулю математиче- ского ожидания значений остатков i e . Проверку случайности значений остатков i e проведем на ос- нове критерия поворотных точек (см. п. 2.4.2). Как видно из рис. 2.28 (столбец G), количество поворотных точек 5 p n = . Тогда неравенство (2.4.8) выполняется ( ) [ ] 2 16 12 29 5 12 2 1.96 4.029 4 3 90 ent ent ⎡ ⎤ ⋅ − > − − = = ⎢ ⎥ ⎣ ⎦ Поэтому имеет место свойство случайности остатков i e . Проверку независимости остатков i e (т.е. отсутствие авто- корреляции) выполним с использованием теста Дарбина–Уотсона (см. п. 2.4.3). На рис. 2.28 показан фрагмент документа Excel, в котором вычисляется по формуле (2.4.10) наблюдаемое значение критерия 2.116 d = . Используя табл. 2.5 выполним линейную экстраполяцию значений H d , B d при 1 k = и числе наблюдений n = 12. Получаем 1.008 H d ≈ , 1.33 B d ≈ . Видно, что вычисляемое значение d находится внутри интервала [ ] [ ] ,4 1.33,2.67 B B d d − = Следовательно, можно говорить о независимости значений остат- ков i e . Проверенные свойства ряда остатков позволяют считать, что построенная линейная модель тренда (2.5.7) адекватно опи- сывает исследуемый временной ряд и ее можно использовать для решения задач прогнозирования. 97 Рис. 2.28. Вычисление значения d (пример 2.5.1) Вычислим точечный прогноз по формулам (2.5.1), (2.5.2) при 13, 14, 15 τ = : ( ) 13 38.23 1.81 13 61.77 t = + ⋅ ≈ ; ( ) 14 38.23 1.81 14 63.58 t = + ⋅ ≈ ; ( ) 15 38.23 1.81 15 65.40 t = + ⋅ ≈ Результаты вычисление интервального прогноза приведены в табл. 2.7. С вероятностью 1 0.95 γ α = − = можно утверждать, что вели- чина ежемесячного финансирования будет находиться в интерва- ле, определяемом вычисленными нижними и верхними граница- ми. 98 Таблица 2.7 Время, l τ ( ) f l δ τ Точечный прогноз Нижняя граница Верхняя граница 13 6.80 61.77 54.97 68.57 14 7.04 63.58 56.55 70.62 15 7.29 65.40 58.10 72.69 ЛАБОРАТОРНАЯ РАБОТА № 1 Выделение трендовой составляющей временного ряда Исходные данные. В таблице приведены значения урожай- ности зерновых совхоза «Путь к коммунизму» Черепановского района за 14 лет, ц/га. Год 1972 1973 1974 1975 1976 1977 1978 Урожайность 17.9 19.5 30.1 26.7 31.0 28.4 20.0 Год 1979 1980 1981 1982 1983 1984 1985 Урожайность 24.7 26.9 21.3 28.6 27.7 30.0 22.9 Необходимо: 1. Используя команду Добавить линию тренда (см. п. 2.2.1) построить следующие модели для трендовой составляющей: ( ) 1 0 1 t b b τ τ = + ; ( ) 2 2 0 1 2 t b b b τ τ τ = + + ; ( ) 2 3 3 0 1 2 3 t b b b b τ τ τ τ = + + + 2. Для каждого уравнения вычислить коэффициенты, индекс детерминации 2 t R , приведенный индекс детерминации 2 t R . 3. Занести в следующую таблицу (на том же листе Excel) уравнение тренда и вычисленные значения 2 t R , 2 t R . Уравнение 2 t R 2 t R 99 4. Анализируя величины 2 t R , 2 t R , найти наилучшую модель ( ) opt t τ трендовой составляющей. 5. Построить графики значений i y , ( ) opt t τ , i e . 6. Используя критерий (2.1.20), проверить возможность заме- ны нелинейного тренда ( ) 3 t τ линейной функцией ( ) 1 t τ 7. Используя наилучшую модель тренда, осуществить прогноз урожайности на следующие годы: 1986, 1988, 1990. Рекомендации: 1. Перед выполнением работы ознакомьтесь с примером 2.2.2, в котором решается подобная задача. 2. Вычисление величин 2 t R , 2 t R осуществлять по формулам (2.1.18), (2.1.28). 3. При выполнении задания 6 использовать пример 2.1.2. ЛАБОРАТОРНАЯ РАБОТА № 2 Исследование модели трендовой составляющей временного ряда Исходные данные. В лабораторной работе № 1 по выборке, представленной в таблице, построена наилучшая модель тренда ( ) opt t τ (для этой модели приведенный индекс детерминации 2 t R имеет максимальное значение среди всех остальных рассмотрен- ных моделей). Необходимо: 1. Вычислить для модели ( ) opt t τ ряд остатков ( ) i i opt i e y t τ = − , 1,2,..., i n = 2. Построить на одном рисунке графики y i , ( ) opt i t τ , i e . 3. Используя критерий (2.4.4), проверить гипотезу о нулевом математическом ожидании остатков i e . 4. Используя критерий поворотных точек, проверить гипотезу о случайности значений остатков i e . 100 5. Используя тест Дарбина–Уотсона, проверить гипотезу о не- зависимости между собой остатков i e . 6. В зависимости от результатов проверки статистических ги- потез п. 3–5 сделать аргументированный вывод об адекватности построенной модели и ее пригодности для решения задач прогно- зирования. Рекомендации: 1. Проверку гипотезы о нулевом математическом ожидании остатков e i осуществить следуя п. 2.4.1 и примеру 2.5.1. 2. Проверку гипотезы о случайности значений остатков e i осуществить следуя п. 2.4.2 и примеру 2.5.1. 3. Проверку гипотезы о независимости остатков e i осущест- вить следуя п. 2.4.3 и примеру 2.5.1. ЛАБОРАТОРНАЯ РАБОТА № 3 Прогнозирование трендовой составляющей временного ряда Исходные данные. В таблице лабораторной работы № 1 приведены значения урожайности зерновых за 14 лет, ц/га. Необходимо: 1. По данным таблицы построить модель линейного тренда вида ( ) 0 1 t b b τ τ = + 2. Вычислить по этой модели точечной прогноз для 1986– 1992 годов. 3. Вычислить интервальный прогноз для 1986–1992 годов. 4. На одном рисунке построить графики y i , ( ) i t τ точечного и интервального прогноза. Рекомендации: 1. При выполнении задания 1 можно использовать команду Добавить линию тренда, описанную в п. 2.2.1. 2. При выполнении задания 3 использовать материал п. 2.5 и примера 2.5.1. 101 КОНТРОЛЬНАЯ РАБОТА Исходные данные. В таблице приведены значения удоев мо- лока от одной коровы одного из хозяйств Новосибирской облас- ти, кг. Номер года 1 2 3 4 5 6 7 Год 1971 1972 1973 1974 1975 1976 1977 Удои 3201 3192 3156 3364 3489 3587 3648 Номер года 8 9 10 11 12 13 14 Год 1978 1979 1980 1981 1982 1983 1984 Удои 3475 3481 3579 3543 3685 3701 3966 Необходимо: 1. По данным таблицы построить диаграмму рассеяния и ви- зуально убедиться в наличии трендовой составляющей. 2. Проверить гипотезу о наличии неслучайной составляю- щей в исследуемом временном ряду. 3. Используя команду Добавить линию тренда (см. п. 2.2.1) построить следующие модели для трендовой составляющей: ( ) 1 0 1 t b b τ τ = + ; ( ) 2 2 0 1 2 t b b b τ τ τ = + + ; ( ) 2 3 3 0 1 2 3 t b b b b τ τ τ τ = + + + 4. Для каждого уравнения вычислить коэффициенты, индекс детерминации 2 t R , приведенный индекс детерминации 2 t R и зане- сти эти значения в следующую таблицу Уравнение 2 t R 2 t R 102 5. Анализируя величины 2 t R , 2 t R для разных уравнений най- ти наилучшую модель ( ) opt t τ трендовой составляющей. 6. Построить графики значений i y , ( ) opt t τ , i e . 7. Используя наилучшую модель тренда осуществить про- гноз удоев на следующие годы: 1986, 1988, 1990. 8. Используя критерий (2.4.4) проверить гипотезу о нулевом математическом ожидании остатков i e . 9. Используя критерий поворотных точек проверить гипоте- зу о случайности значений остатков i e . 10. Используя тест Дарбина–Уотсона проверить гипотезу о независимости между собой остатков i e . 11. В зависимости от результатов проверки статистических гипотез п. 3–5 сделать аргументированный вывод об адекватности построенной модели и ее пригодности для решения задач прогно- зирования. 12. Для модели линейного тренда осуществить точечный прогноз удоев на следующие годы: 1986, 1988, 1990. Сравнить сделанный прогноз с прогнозом, построенном в задании 7. 13. Для модели линейного тренда осуществить интерваль- ный прогноз удоев на следующие годы: 1986, 1988, 1990. ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ 1. Что понимается под терминами «выделить трендовую со- ставляющую» или «выделить тренд»? 2. Перечислите основные подходы, используемые для выде- ления трендовой составляющей. 3. Сущность регрессионного метода выделения тренда вре- менного ряда. 4. Сущность метода скользящего среднего выделения тренда временного ряда. 5. Сущность метода экспоненциального сглаживания для выделения тренда временного ряда. 103 6. Реализация регрессионного метода выделения тренда вре- менного ряда в табличном процессоре Excel. 7. Что такое периодическая функция и ее представление три- гонометрическим рядом? 8. Сущность выделения тригонометрической составляющей методами гармонического анализа. 9. Построение точечного прогноза для трендовой состав- ляющей временного ряда. 10. Построение интервального прогноза для трендовой со- ставляющей временного ряда. 11. Различие между точечным и интервальным прогнозом трендовой составляющей временного ряда. 12. Как нужно изменить дисперсию 2 σ для уменьшения «ширины» интервала прогнозирования трендовой составляющей временного ряда? 104 |