Тема методы экстраполяции
Скачать 0.52 Mb.
|
Тема 3. МЕТОДЫ ЭКСТРАПОЛЯЦИИ План 1. Временной ряд: понятие и виды 2. Основные компоненты временного ряда 3. Методы прогнозирования временных рядов 3.1. Статистические методы прогнозирования 3.2. Прогнозирование на основе тренда 1. Временной ряд: понятие и виды Временные ряды отражают динамику социально-экономических явле- ний. Модели, построенные по данным, характеризующие один объект за ряд последовательных периодов, называют моделями временных рядов. ВРЕМЕННОЙ РЯД – это совокупность значений какого-либо показа- теля за несколько последовательных моментов или периодов времени 1 ВРЕМЕННОЙ РЯД – это последовательность упорядоченных во време- ни числовых показателей, характеризующих уровень развития изучаемого яв- ления. Любой временной ряд включает два обязательных элемента: 1) время t, 2) значение показателя, или уровень ряда y i Количественные значения показателя во временном ряду называются уровнями, где y 1 – начальный уровень ряда, а y n – конечный уровень ряда. Уровни расположены в хронологическом порядке через равные промежутки времени. Временные ряды различаются по следующим признакам: 1) по времени - моментные и интервальные. Временной ряд, уровни которого характеризуют состояние явления на определенные моменты времени, называют моментным. Например: числен- ность студентов группы на начало семестра. В моментных рядах период между датами называется интервалом ряда. В данном примере интервал равен 1 семе- стру. 1 В отечественной литературе используются два синонима этого термина: «динамический ряд» и «ряд динами- ки». Временной ряд, уровни которого характеризуют объем признака за опре- деленный период времени, называют интервальным. Например, заработная плата работников за месяц. В этом временном ряду месяц является интервалом. Но существует разница в понятии «интервал» в моментном и интерваль- ном рядах. В моментном ряду интервал – это промежуток времени между дву- мя датами, на которые приведены сведения. В интервальном ряду интервал – это промежуток времени, за который обобщены приводимые сведения Отсюда вытекает важное следствие: показатели интервальных рядов ди- намики обладают свойством суммарности, а показатели моментных рядов тако- го свойства не имеют. Можно сложить месячные данные о заработной плате и получить годовой фонд оплаты труда. Но за год сложить данные о численности работников на начало каждого месяца, то полученная сумма не будет иметь смысла. 2) по форме представления уровней: ряды абсолютных величин (товарооборот, товарные запасы); ряды относительных величин (индексы инфляции); ряды средних величин (потребление продуктов питания на 1 члена се- мьи). 3) по длине интервала: равноотстоящие (полные) ряды; неравноотстоящие (неполные) ряды. 4) по числу показателей: изолированные (одномерные); многомерные (комплексные), когда в хронологической последователь- ности дается система показателей, связанных между собой единством процесса или явления. При помощи построения и анализа временных рядов можно выявить за- кономерности и особенности развития явлений. Вопрос: Динамический ряд характеризует: а) изменение явления во времени; б) вариацию значений признака; в) рассеяние значений признака; г) особенности развития явлений. 2. Основные компоненты временного ряда Влияние различных факторов на величины уровней временного ряда но- сит различный характер. Влияние одних проявляется постепенно в течение продолжительных промежутков времени, других – периодически, а некоторых случайно и нерегулярно. Поэтому каждый уровень можно рассматривать как композицию компо- нент, имеющих разный временной характер действия. Каждый уровень временного ряда формируется под воздействием боль- шого числа факторов, которые можно разделить на три группы: 1) длительные, постоянно действующие факторы, оказывающие на изу- чаемое явление определяющее влияние и формирующие основную тенденцию ряда. Они будут составлять трендовую компоненту T. 2) кратковременные, периодические факторы, формирующие циклические (или сезонные) колебания ряда. Они будут составлять циклическую (или се- зонную) компоненту S. 3) случайные факторы, отражаемые случайными изменениями уровней ряда. Они будут составлять случайную компоненту Е. Итак, временной ряд может иметь различное сочетание трендовой (трен- да), циклической и случайной компонент. 3. Методы прогнозирования временных рядов Изучение закономерностей развития явлений, выявление трендов и их моделей создает базу для прогнозирования, т.е. для определения ориентировоч- ных размеров явлений в будущем. Любой метод прогнозирования предполагает, что закономерность разви- тия, действовавшая в прошлом, сохранится и в прогнозируемом будущем, т.е. прогноз основан на экстраполяции этой закономерности на будущее, поэтому точность прогноза зависит от того, насколько близкими к действительности окажутся эти предположения. ЭКСТРАПОЛЯЦИЯ – нахождение уровней за пределами изучаемого ря- да, т.е. продление в будущее тенденции, наблюдавшейся в прошлом (рис. 3.1). Нахождение по имеющимся данным за определенный период времени некоторых недостающих значений признака внутри этого признака называется ИНТЕРПОЛЯЦИЕЙ (рис. 3.2). При прогнозировании на основе временных рядов могут использоваться различные методы в зависимости от исходной информации. Рис. 3.1. Нахождение значение за пределами этого признака Рис. 3.2. Нахождение значение внутри этого признака 3.1. Статистические методы прогнозирования Статистические методы прогнозирования связаны с выявлением основ- ной тенденции развития явления. В некоторых случаях закономерность изменения явления, общая тенден- ция его развития явно и отчетливо отражается уровнями временного ряда (уровни на изучаемом периоде непрерывно растут или непрерывно снижают- 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80 100 ся). Однако часто приходится встречаться с такими временными рядами, в ко- торых уровни ряда претерпевают самые различные изменения (то возрастают, то убывают), и общая тенденция развития неясна. Поэтому при анализе динамики речь идет об основной тенденции, доста- точно стабильной на протяжении изученного этапа развития. ОСНОВНАЯ ТЕНДЕНЦИЯ (ТРЕНД) – плавное и устойчивое измене- ние уровня явления во времени, свободное от случайных колебаний. Основную тенденцию можно представить либо графически (рис. 3.3), ли- бо аналитически в виде уравнения тренда. Рис. 3.3. Временной ряд численности населения России Для выявления основной тенденции динамического ряда необходимо провести сглаживание временного ряда, для чего можно использовать следую- щие методы: 1) метод укрупнения интервалов и их характеристика средними уровня- ми. Метод заключается в переходе от менее продолжительных интервалов к бо- лее (сутки неделя декада месяц …), одновременно уменьшается ко- личество интервалов. Если уровни ряда колеблются с определенной периодич- ностью, то укрупненный интервал целесообразно взять равным периоду коле- баний. Если такая периодичность отсутствует, то производится постепенное укрупнение интервалов до тех пор, пока общее направление тренда не станет отчетливым. 2) метод скользящей средней. Метод заключается в замене фактических уровней рядом подвижных (скользящих) средних, которые рассчитываются для 0 20000 40000 60000 80000 100000 120000 140000 160000 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 Численность населения, тыс.чел. определенных последовательно подвижных интервалов и относятся к середине каждого из них. Для сглаживания, т.е. выявления тренда, необходимо последо- вательно суммировать по k уровней и результаты делить на k. Т.е. исчисляется средний уровень из определенного числа, обычно нечет- ного (3, 5, 7 и т.д.), первых по счету уровней, затем – из такого же числа уров- ней, но начиная со 2-го по счету, далее – начиная с 3-го и т.д. Таким образом, средняя как бы «скользит» по ряду динамики, передвигаясь на один срок. Недостатком сглаживания ряда является «укорачивание» от начала и от конца на 2 1 k уровней по сравнению с фактическим рядом, а, следовательно, потеря информации. При этом сглаженный ряд меньше, чем фактический подвержен колеба- ниям из-за случайных причин, и четче выражает основную тенденцию роста явления за изучаемый период, связанную с действием долговременно сущест- вующих причин и условий развития. Вычисления с помощью этого метода довольно просты и достаточно точ- но отражают изменения основных показателей предыдущего периода. Иногда при составлении прогноза они эффективнее, чем методы, основанные на долго- временных наблюдениях. Наиболее простой метод статистического прогнозирования предполагает использование средних характеристик ряда динамики: среднего абсолютного прироста и среднего темпа роста. Этот метод основан на предположении о равномерном изменении уров- ней. Если в базовом периоде цепные показатели динамики не имели резких ко- лебаний, то экстраполяцию можно делать с помощью следующих способов: с помощью среднего абсолютного прироста. Скорость изменения уровней временного ряда за определенный отрезок времени характеризуется средним абсолютным приростом. Предполагая его стабильным, прогноз можно дать в виде следующей экстраполяции: y k y y n k n , (3.1) где k n y - прогнозируемый уровень; k - период экстраполяций (год, два,....); у n - последний уровень динамического ряда; y - средний абсолютный прирост, 1 0 n y y y n Использование в экстраполяции среднего абсолютного прироста отно- сится в прогнозировании к классу «наивных» моделей, т.к. предполагается, что развитие явления происходит по арифметической прогрессии, но чаще всего развитие явления следует по иному пути. Вместе с тем в ряде случаев этот ме- тод может найти применение как предварительный прогноз, если у исследова- теля нет временного ряда: информация дана лишь на начало и конец периода предистории. с помощью среднего темпа роста. Прогнозное значение уровня, исходя из среднего коэффициента роста, можно получить по формуле: , к p n k n K y y (3.2) где P K - средний темп роста в коэффициентах, 1 0 n n y y К р Данный прием экстраполяции предполагает, что уровни временного ряда изменятся в геометрической прогрессии, что не всегда соответствует реально- сти. Кроме того, формула расчета среднего коэффициента роста ориентирована на достижение конечного (y n ) уровня временного ряда. И если на конце вре- менного интервала уровень резко изменился (рост сменился спадом) и оказался ниже начального (у 0 ), то прогноз распространится на будущую тенденцию па- дения, которой на самом деле не было. 3.2. Прогнозирование на основе тренда При наличии тенденции во временном ряду его уровни можно рассмат- ривать как функцию времени: ) (t f y t , (3.3) где t y - уровни динамического ряда, вычисленные по соответствующему анали- тическому уравнению на момент времени t. Уравнение, которое выражает зависимость уровней динамического ряда от фактора времени t ,называется УРАВНЕНИЕМ ТРЕНДА. Выбор типа модели зависит от цели исследования и должен быть основан на теоретическом анализе, выявляющем характер развития явления, а также на графическом изображении ряда динамики (линейной диаграмме). В настоящее время компьютерные программы анализа временных рядов предлагают достаточно широкий набор математических функций для построе- ния уравнения тренда. Наиболее часто используются полиномы k-ой степени, экспоненты, различного рода кривые с насыщением. Например, простейшими моделями, выражающими тенденцию развития, являются: линейная функция – прямая t a a у t 1 0 ˆ , показательная функция t t a a у 1 0 ˆ , кривая 2-го порядка (парабола) 2 2 1 0 ˆ t a t a a у t , где а 0 , а 1 , а 2 – параметры уравнения, t – время. После выбора вида кривой (прямая, показательная функция, парабола 2- го порядка и др.) рассчитываются ее параметры. При использовании полиномов разных степеней оценка параметров про- изводится по методу наименьших квадратов (МНК): строится система нор- мальных уравнений, число которых соответствует числу параметров полинома. Так для линейного тренда система нормальных уравнений следующая: yt t a t a y t a na 2 1 0 1 0 (3.4) где n - число уровней ряда динамики, t - условное обозначение фактора времени порядковыми номерами. Отсчет времени начинается с 1 (например, если рассчитывается уравнение тренда по данным за январь, февраль, март ..., декабрь 2011 года, то время t, которое вво- дится в качестве независимой переменной, будет обозначено следующим обра- зом: январь - 1, февраль - 2, март - 3, ...декабрь - 12), у - фактические уровни ряда динамики. На основе найденного уравнения кривой модели тренда рассчитываются выровненные уровни ряда, таким образом технически выравнивание ряда за- ключается в замене фактических уровней выровненными. Процесс вычисления параметров трендовых моделей при ручном способе счета может быть упрощен, если взять t как отклонение от центра, т.е. 0 t 2 Если число уровней в динамическом ряду нечетное, то временные периоды обозначаются следующим образом: 2 Если 0 t , это не значит, что 0 2 t , как и в любой другой четной степени, т.к., например, для данных из табл. 4.6 получается 70 5 3 1 ) 1 ( ) 3 ( ) 5 ( 2 2 2 2 2 2 2 t И аналогично, если 0 t , то выполняется 0 3 t и 0 1 t , как и для любой нечетной степени, напри- мер, для данных из табл.4.6: 0 5 3 1 ) 1 ( ) 3 ( ) 5 ( 3 3 3 3 3 3 3 t , 0 1 1 3 1 5 1 1 1 3 1 5 1 1 t Таблица 3.1 Временные периоды январь фев- раль март апрель май Уровни динамического ряда y 1 y 2 y 3 y 4 y 5 Обозначение временных перио- дов (t) -2 -1 0 1 2 Если число уровней в динамическом ряду четное, то временные периоды обозначаются следующим образом: Таблица 3.2 Временные периоды ян- варь фев- раль март ап- рель май июнь Уровни динамического ряда y 1 y 2 y 3 y 4 y 5 y 6 Обозначение временных перио- дов (t) -5 -3 -1 1 3 5 Тогда системы нормальных уравнений упрощаются, при выравнивании по прямой она примет вид: , 0 n a y 2 1 t a yt Из системы получаем: n y a 0 , 2 1 t yt a . (3.5) От того, как обозначен фактор времени t, зависит изменение значения параметра а 0 Следует обратить внимание, что сумма фактических значений у и сумма выровненных t y должны приближенно быть равны: t y у. Если такого ра- венства нет, уравнение тренда рассчитано неверно. Например, имеются данные о численности студентов заочного обучения вуза на начало года (табл. 3.3, графы А, 1). На основании имеющихся данных выполните точечный прогноз на 2012- 2013 гг. с помощью статистических методов прогнозирования и с помощью ли- нейного уравнения тренда. Таблица 3.3 Расчет уравнения тренда ряда динамики численности студентов вуза Годы Число студентов, чел. (у) t t 2 yt t y А 1 2 3 4 5 2007 950 1 1 950 978,5 2008 1142 2 4 2284 1089,3 2009 1195 3 9 3585 1200,1 2010 1278 4 16 5112 1310,9 2011 1436 5 25 7180 1421,7 Итого 6001 15 55 19111 6000,5 1) Прогнозирование с помощью среднего абсолютного прироста. Среднегодовой абсолютный прирост численности студентов заочного обучения вуза равен: 5 , 121 4 486 1 5 950 1436 1 0 1 n y у у (чел.). Тогда, прогноз численности студентов: на 2012 г. .) ( 5 , 1557 5 , 121 1 1436 1 5 6 чел y y , на 2013 г.: .). ( 1679 5 , 121 2 1436 2 5 7 чел y y 2) Прогнозирование с помощью среднего темпа роста. Средний темп роста можно рассчитать следующим образом: %. 9 , 110 109 , 1 511 , 1 950 1436 4 1 5 1 1 или y y K n n P Рассчитаем прогноз численности студентов: на 2012 г.: 1 5 6 y y = 1436 1,109 = 1592,5 (чел.); на 2013 г.: 2 5 7 y y =1436 (1,109) 2 = 1766,1 (чел.). 3) Прогнозирование на основе уравнения тренда. Для прогнозирования по прямой следует получить уравнение: 1 0 t a a y t Для расчета параметров а 0 и а 1 решается система нормальных уравнений: yt t a t a y t a na 2 1 0 1 0 где n - число уровней ряда динамики, t - условное обозначение фактора времени порядковыми номерами, у - фактические уровни ряда динамики. В качестве расчетных добавим в таблицу 3.3 гр. 3 и 4. В гр. 3 значения t возводим в квадрат (1 2 = 1, 2 2 = 4 и т.д.), в графе 4 находим произведение уt (950 1 = 950, 1142 2 = 2284 и т.д.). В систему нормальных уравнений подстав- ляем данные итоговой строки, в которой предварительно произведем суммиро- вание: 5а о + 15а 1 = 6001 3 15а о + 55а 1 = 19111 Умножим каждый член первого уравнения на 3, затем вычтем из второго уравнения первое: 15а о + 45а 1 = 18003 15а 0 + 55а 1 = 19111 10а 1 = 1108 Отсюда а 1 = 8 , 110 10 1108 Подставим его значение в первое уравнение, чтобы рассчитать параметр а о : 5а о +15 110,8 = 6001, 5а о = 6001 –1662 , а о = 6 , 867 5 4339 Уравнение тренда примет вид: t y = 867,6 + 110,8t. Подставляя в него зна- чения t для каждого года, найдем выровненные (теоретические) значения. Для 2007 г. t y = 867,6 + 110,8 1 = 978,5, для 2008 г. t y = 867,6 + 110,8 2 = 1089,3 и т.д. Занесем их в гр. 5 табл. 3.3. Следует обратить внимание, что сумма фактических значений у и сумма выровненных t y должны приближенно быть равны: t y у (6000,5 6001). Ряд выровненных значений t y характеризует тенденцию стабильного возрастания числа студентов в вузе, при этом численность студентов увеличи- вается в среднем на 110,8 чел. в год. Чтобы использовать уравнение тренда для экстраполяции временного ря- да, в уравнение тренда подставляют продолженное значение времени. Напри- мер, для 2012 г. t = 6 (продолжим нумерацию), тогда расчетный уровень ряда динамики, соответствующий 2012 г., вычислим 6 y = 867,6+ 110,8 6 = 1532,5 (чел.), для 2013 г.: 7 y = 867,6 + 110,8 7 = 1643,3 (чел.). Вопрос: … – нахождение уровней за пределами изучаемого ряда, т.е. продление в будущее тенденции, наблюдавшейся в прошлом |