Статистика учебник. Тарновская ли. Статистика учебное пособие
Скачать 3.85 Mb.
|
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. как динамические ряды отличаются от статистических совокупностей. К оцениванию доверительных интервалов для кривых роста следует подходить с известной долей осторожности. Методы, разработанные для статистических совокупностей, дозволяют определить доверительный интервал, зависящий от стандартной ошибки оценки прогнозируемого показателя, от времени будущего прогноза, от количества уровней во временном ряду и от уровня значимости ошибки) прогноза. Стандартная (средняя квадратическая) ошибка оценки прогнозируемого показателя определяется по формуле k n y y S t t y − ∑ − = 2 ˆ ) ˆ ( , где фактическое значение уровня временного ряда для времени t; t yˆ – расчетная оценка соответствующего показателя по модели (например, по уравнению кривой роста п – количество уровней в исходном ряду k – число параметров модели. В случае прямолинейного тренда для расчета доверительного интервала можно использовать аналогичную формулу для парной регрессии таким образом, доверительный интервал прогноза в этом случае будет иметь вид ) 1 ( ) 1 2 ( 3 1 1 ˆ ˆ 2 2 ˆ − − + + + ± = α n n t n n S t y Y Y t t , где t – период прогнозирования t yˆ – точечный прогноз по модели на t момент времени п – количество наблюдений во временном ряду Y S ˆ – стандартная ошибка оценки прогнозируемого показателя, рассчитанная по ранее приведенной формуле для числа параметров модели, равного двум α t – табличное значение критерия Стьюдента для уровня значимости и для числа степеней свободы, равного п – 2. Если выражение ) 1 ( ) 1 2 ( 3 1 1 обозначить через K то формула для доверительного интервала примет вид Значения величины К для оценки доверительных интервалов прогно- Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. за относительно линейного тренда табулированы. Пример. Для временного ряда, представленного в табл. 10.16, построена трендовая модель в виде полинома первой степени. Требуется дать прогноз на два шага впереди с учетом доверительных интервалов на основе адекватной модели y t = 87,8 – 3,4t: 4 , 50 11 4 , 3 8 , 87 ˆ ; 8 , 53 10 4 , 3 8 , 87 ˆ 11 Таблица 10.16 Доверительный интервал прогноза Время прогноза t Точечный прогноз, нижняя граница верхняя граница Средняя квадратическая ошибка прогнозируемого показателя 39 , 1 Значения величины K = 1,77 для t = 10 и K = 1,88 для t = 11 взяты по табличным данным. Прогнозируемые величины попадают в интервалы 88 , 1 39 , 1 8 , 53 ˆ ; 77 , 1 39 , 1 8 , 53 ˆ ; ˆ ˆ 11 Формула для расчета доверительных интервалов прогноза относительно тренда, имеющего вид полинома второго или третьего порядка, выглядит следующим образом , ) ( 4 2 2 2 1 1 2 2 4 2 4 где t – время, для которого делается прогноз. Аналогично вычисляются доверительные интервалы для экспоненциальной кривой роста, а также для кривых роста (модифицированная экспонента, кривая Гомперца, логистическая кривая. Таким образом, формулы расчета доверительного интервала для трен- Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. довых моделей разного класса различны, но каждая из них отражает динамический аспект прогнозирования, те. увеличение неопределенности прогнозируемого процесса с ростом периода прогнозирования. Несмотря на громоздкость некоторых формул, расчет точечных и интервальных прогнозов на основе трендовых моделей в форме кривых роста технически является достаточно простой процедурой. Оптимальная длина периода прогнозирования определяется отдельно для каждого экономического явления. Эта длина, как правило, не превышает для рядов годовых наблюдений одной трети объема данных, а для квартальных и месячных рядов – двух лет. При выравнивании временных рядов с использованием кривых роста приходится решать вопрос о том, какой длины должен быть ряд, выбираемый для прогнозирования. Очевидно, что если период ряда динамики слишком короткий, можно не обнаружить тенденцию его развития. С другой стороны, очень длительный временной ряд может охватывать периоды с различными трендами и его описание с помощью одной кривой роста не даст положительных результатов. Поэтому рекомендуется брать возможно больший промежуток времени. Если развитие обнаруживает циклический характер, следует брать период от середины первого до середины последнего периода цикла. Если ряд охватывает периоды с разными трендами, лучше сократить ряд, отбросив наиболее ранние уровни, которые относятся к периоду с иной тенденцией развития. При прогнозировании с использованием трендовых моделей весьма важным является заключительный этап – верификация прогноза. Верификация трендовых моделей сводится к сопоставлению расчетных результатов по модели с соответствующими данными действительности – массовыми фактами и закономерностями экономического развития. Верификация прогнозной модели представляет собой совокупность критериев, способов и процедур, позволяющих на основе многостороннего анализа оценивать качество получаемого прогноза. Однако чаще всего на этапе верификации в большей степени осуществляется оценка метода прогнозирования, с помощью которого был получен результат, чем оценка качества самого результата. Это связано стем, что до сих пор не найдено эффективного подхода к оценке качества прогноза до его реализации. В большинстве случаев информация делится на две части. Часть, охватывающая более ранние данные, служит для оценивания параметров прогностической кривой роста, другая, более поздняя, рассматривается как реализация прогноза. Полученные таким образом ошибки прогноза в ка- кой-то мере характеризуют точность применяемой методики прогнозирования. Проверка точности одного прогноза недостаточна для оценки каче- Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ства прогнозирования, так как она может быть результатом случайного совпадения. Наиболее простой мерой качества прогнозов при условии, что имеются данные об их реализации, является отношение числа случаев, когда фактическая реализация охватывалась интервальным прогнозом, к общему числу прогнозов. Данную меру качества прогнозов K можно вычислить по формуле Q P P K + = , где P число прогнозов, подтвержденных фактическими данными Q число прогнозов, неподтвержденных фактическими данными [15–20]. 10.3. Прогнозирование на основе анализа причинных связей В реальной практике социально-экономические явления зависят не только от фактора времени, но и ряда других факторов внешней среды (см. гл. 8). Например, рост производительности труда во времени может, кроме прочего, иметь зависимость от уровня энергонасыщснности производства, изменения доли активной части основных производственных фондов в их общем объеме, уровня оплатоемкости продукции и т. д. Колебания уровня цен также, кроме фактора времени, могут зависить от количества выпускаемой продукции, от изменения в регионе спроса на эту продукцию, от истощения производственных ресурсов и т. д. Модель, которая бы воспроизводила зависимость (у)от фактора времени) и других факторов в общем виде может быть записана как Тогда, например, линейная модель тренда будет t a x a x a x a a y m m m t 1 2 2 1 1 Исходные данные при этом компонуются в виде матрицы данных по годам см. табл. 10.13). Прогноз определяется поданным множественной регрессионной модели аналогично вышеизложенным парным регрессионным моделям, его надежность устанавливается при помощи известных оценок адекватности модели среднее квадратическое отклонение, коэффициент детерминации, критерий Фишера и др. При этом важно не только качественно измерить уровень достоверности модели, но и найти пределы, в которых прогнозное значение можно ожидать с наибольшей вероятностью. С этой целью исчисляют две величины – стандартную ошибку модели – стандартную ошибку прогноза. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. После нахождения стандартной ошибки прогноза находят доверительные интервалы и осуществляют прогноз [14–18]. 10.4. Прогнозирование при наличии периодических колебаний При наличии периодических колебаний во временном ряду методы прогнозирования должны учитывать эти колебания. С этой целью используется гармонический анализ. Например, на рис. 10.5 приведен временной ряд с периодическими колебаниями. Рис. 10.5. Периодический временной ряд Уровни временного ряда варьируют вокруг среднего значения y , при этом эти колебания (волны) повторяются, те. это пример периодического временного ряда. Интервал времени, необходимый для того, чтобы временной ряд начал повторяться, называется периодом (Р). Его величина расстояние между пиками) для примера составляет 10 месяцев. Если ряд имеет период Р,то он, как правило, имеет также период 2Р,3Р и т. п. В общем случае для периодического временного ряда справедливо равенство t t с, где с = 1, 2, ... Величина, обратная периоду, называется частотой динамического ряда P f 1 = . Частота указывает число повторений цикла в единицу времени. Отклонение от среднего уровня до пика (или впадины) называется амплитудой временного ряда А Расстояние между началом отсчета времени (точкой, в которой t = 0) и ближайшим пиковым значением назы- Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. вается фазой ( θ ) . Периодический временной ряд, представленный на рис. 10.5, можно задать четырьмя параметрами периодом (Р, частотой (f), амплитудой (А, фазой ( θ ) и средним значением ( y ). Поэтому временной ряд можно записать в виде ) cos( θ − ω ⋅ + = t A y y t , такое представление называется гармоническим. В этом выражении ω – угловая частота, измеряемая в радианах в единицу времени ; 2 0 ; 2 π ≤ ω ≤ π = ω f θ – фаза. Данное выражение часто записывают через синусы и косинусы без упоминания о фазе t b t a y t y ω ⋅ + ω ⋅ + = sin cos , где Существует тригонометрическое тождество , , 1 sin cos 2 2 2 те. существует взаимосвязь между амплитудой колебаний и параметрами гармоники. Кроме того, Теоретически временной ряд может быть представлен как сумма среднего значения и ряда синусоид и косинусоид, что и называется рядом Фурье ∑ ω ⋅ + ∑ ω ⋅ + = = = n i n i t i i b t i i a y t y 1 1 sin cos , где 2 N n = ; N – длина временного ряда. При этом y часто заменяется параметром 0 a , те. в окончательном виде имеем ∑ ω ⋅ + ∑ ω ⋅ + = = = n i i i n i i i t t b t a a y 1 1 0 sin Оценка параметров данного уравнения осуществляется с помощью метода наименьших квадратов, который приводит к системе нормальных уравнений. Уравнение для случая одной гармоники имеет вид t b t a a y t sin cos 1 1 0 ⋅ + ⋅ + = , Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. где t принимает значения от 0 с постоянным увеличением на Параметры уравнения определяются по формулам ∑ ⋅ ∑ = ⋅ = ∑ = t y N b t y N a N y a t sin 2 ; cos 2 ; 1 Уравнение для случая двух гармоник имеет вид t b t a t b t a a y t 2 sin 2 cos sin cos 2 2 1 Параметры уравнения определяются по формулам ∑ ⋅ ∑ = ⋅ = t y N b t y N a 2 sin 2 ; 2 cos 2 Пример Производство товара К по месяцам характеризуется следующими данными (табл. 10.17). Таблица 10.17 Номер месяца 1 2 3 4 5 6 7 8 9 10 t y 22 24 23 14 6 5 6 8 15 17 Номер месяца 11 12 13 14 15 16 17 18 19 20 t y 24 25 24 18 8 5 9 14 19 23 Графическое представление временного ряда – на рис. 10.6. Рис. 10.6. Периодический ряд динамики производства товара К Для данных, приведенных в табл. 10.18, рассчитаны средняя величина и дисперсия 15 , 52 ; 45 , 15 Расчеты для определения параметров ряда Фурье представлены в табл. 10.18. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Таблица 10.18 № t y t t cos t sin t 2 cos t 2 sin t 3 cos t 3 sin t 4 cos t 4 sin 1 22 0 1 0 1 0 1 0 1 0 2 24 π 1 , 0 0,951 0,309 0,809 0,588 0,588 0,809 0,309 0,951 3 23 π 2 , 0 0,809 0,588 0,309 0,951 –0,309 0,951 –0,809 –0,588 4 14 π 3 , 0 0,588 0,809 –0,309 0,951 –0,951 0,309 –0,809 –0,588 5 6 π 4 , 0 0,309 0,951 –0,809 0,588 –0,809 –0,588 0,309 –0,951 6 5 π 5 , 0 0 1 –1 0 0 –1 1 0 7 6 π 6 , 0 –0,309 0,951 –0,809 –0,588 0,809 –0,588 0,309 0,951 8 8 π 7 , 0 –0,588 0,809 –0,309 –0,951 0,915 0,309 –0,809 0,588 9 15 π 8 , 0 –0,809 0,588 0,309 –0,951 0,309 0,951 –0,809 –0,588 10 17 π 9 , 0 –0,951 0,309 0,809 –0,588 –0,588 0,809 0,309 –0,951 11 24 π 1 –1 0 1 0 –1 0 1 0 12 25 π 1 , 1 –0,951 –0,309 0,809 0,588 –0,588 –0,809 0,309 0,951 13 24 π 2 , 1 –0,809 –0,588 0,309 0,951 0,309 –0,951 –0,809 0,588 14 18 π 3 , 1 –0,588 –0,809 –0,309 0,951 0,951 –0,309 –0,809 –0,588 15 8 π 4 , 1 –0,309 –0,951 –0,809 0,588 0,809 0,588 0,309 –0,951 16 5 π 5 , 1 0 –1 –1 0 0 1 1 0 17 9 π 6 , 1 0,309 –0,951 –0,809 –0,588 –0,809 0,588 0,309 0,951 18 14 π 7 , 1 0,588 –0,809 –0,309 –0,951 –0,951 –0,309 –0,809 0,588 19 19 π 8 , 1 0,809 –0,588 0, 309 –0,951 –0,309 –0,951 –0,809 –0,588 20 23 π 9 , 1 0,951 –0,309 0,809 –0,588 0, 588 –0, 809 0,309 –0,951 ∑ 309 0 0 0 0 0 0 0 0 Отсчет t ведется с 0, прибавляя каждый раз величину N π 2 , те. Таблица содержит значения t cos , t sin , t 2 cos , t 2 sin , t 3 cos , t 3 sin , t 4 cos , t 4 sin для расчета параметров уравнения с четырьмя гармониками 4 sin 4 cos 3 sin 3 cos 2 sin 2 cos sin cos 4 4 3 3 2 2 1 Для нахождения параметров рассчитываются следующие значения ∑ ∑ = − = ∑ ∑ − = − = ∑ ∑ = = ∑ ∑ − = = 274 , 11 4 sin ; 753 , 16 4 cos ; 568 , 10 3 sin ; 698 , 2 3 cos ; 577 , 26 2 sin ; 883 , 92 Параметры уравнения составят Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 1274 , 1 ; 6753 , 1 ; 0568 , 1 ; 2698 , 0 ; 6577 , 2 ; 2883 , 9 ; 7944 , 1 ; 6667 , 0 4 4 3 3 2 2 Ряд Фурье с одной гармоникой имеет вид t t y t sin 7948 , 1 cos 6667 , 0 45 , 15 ⋅ + ⋅ + = , с четырьмя гармониками – 4 sin 1274 , 1 4 cos 6753 , 1 3 sin 0568 , 1 3 cos 2698 , 0 2 sin 6577 , 2 2 cos 2883 , 9 sin 7948 , 1 cos 6667 , 0 Далее проводится выбор того ряда Фурье, который наилучшим образом отражает исходный временной ряд. Для этой цели определяются теоретические (расчетные) значения по ряду Фурье, а также отклонения фактических данных от расчетных ) ˆ ( y y t − . Отклонения используются для расчета остаточной дисперсии и коэффициента детерминации 1 ; ) ˆ ( 2 ост 2 2 ост. σ σ − = ∑ − = σ R n y y t Данные расчета для примера приведены в табл. Таблица 10.19 Остаточная дисперсия и коэффициент детерминации Число гармоник Гармоническая функция Остаточная дисперсия Коэффициент детерминации 1 t t sin 7948 , 1 cos 667 , 0 − 50,315 0,0351 2 t t 2 sin 6577 , 2 2 cos 2883 , 9 − 3,646 0,930 3 t t 3 sin 0568 , 1 3 cos 2698 , 0 − − 3,046 0,942 4 t t 4 sin 1274 , 1 4 cos 6753 , 1 + − 1,256 0,976 Таблица показывает, что уже уравнение с двумя гармониками хорошо описывает исходный временной ряд, объясняя 93 % вариации уровней. Как видно из рис. 10.6, для рассматриваемого временного ряда амплитуда колебаний (А) приближается к 10, что соответствует для уравнения с двумя гармониками |