66 Молчанова Статистика УМК без титула (1). I. Теория статистики
Скачать 1.56 Mb.
|
1.10.3 Методы выравнивания рядов динамики Важной задачей статистики при анализе рядов динамики является определение основной тенденции развития, присущей тому или иному ряду динамики. Например, за колебаниями урожайности какой-либо сельскохозяйственной культуры в отдельные годы тенденция роста (уменьшения) урожайности может не просматриваться непосредственно, и поэтому должна быть выявлена статистическими методами. Методы анализа основной тенденции в рядах динамики разделяются на две основные группы: 1) сглаживание или механическое выравнивание отдельных членов ряда динамики с использованием фактических значений соседних уровней; 2) выравнивание с применением кривой, проведенной между конкретными уровнями таким образом, чтобы она отображала тенденцию, присущую ряду и одновременно освободила его от незначительных колебаний. Рассмотрим методы каждой группы. Метод укрупнения интервалов. Если рассматривать уровни экономических показателей за короткие промежутки времени, то в силу 208 влияния различных факторов, действующих в разных направлениях, в рядах динамики наблюдается снижение и повышение этих уровней. Это мешает видеть основную тенденцию развития изучаемого явления. В этом случае для наглядного представления тренда применяется метод укрупнения интервалов, который основан на укрупнении периодов времени, к которым относятся уровни ряда. Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д. Метод простой скользящей средней. Сглаживание ряда динамики с помощью скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем средний уровень из такого же числа уровней, начиная со второго, далее - начиная с третьего и т.д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень вначале и добавляя один следующий. Отсюда название - скользящая средняя. Расчет скользящей средней по данным об урожайности зерновых культур приведен в таблице 1.10.5. Сглаженный ряд урожайности по трехлетиям короче фактического на один член ряда в начале и в конце, по пятилетиям – на два в начале и в конце ряда. Он меньше, чем фактический подвержен колебаниям из-за случайных причин, и четче выражает основную тенденцию роста урожайности за изучаемый период, связанную с действием долговременно существующих причин и условий развития. Таблица 1.10.5 Сглаживание урожайности зерновых культур методом скользящей средней Фактический уровень урожайности, ц/га Скользящая средняя трехлетняя пятилетняя 15,4 14,0 17,6 15,4 10,9 17,5 15,0 18,5 14,2 14,9 - (15,4+14,0+17,6)/3=15,7 (14,0+17,6+15,4)/3=15,7 (17,6+15,4+10,9)/3=14,6 (15,4+10,9+17,5)/3=14,6 (10,9+17,5+15,0)/3=14,5 (17,5+15,0+18,5)/3=17,0 (15,0+18,5+14,2)/3=15,9 (18,5+14,2+14,9)/3=15,9 - - - (15,4+14,0+17,6+15,4+10,9)/5=14,7 (14,0+17,6+15,4+10,9+17,5)/5=15,1 (17,6+15,4+10,9+17,5+15,0)/5=15,2 (15,4+10,9+17,5+15,0+18,5)/5=17,1 (10,9+17,5+15,0+18,5+14,2)/5=16,8 (17,5+15,0+18,5+14,2+14,9)/5=17,6 - - Недостаток метода простой скользящей средней состоит в том, что сглаженный ряд динамики сокращается ввиду невозможности получить сглаженные уровни для начала и конца ряда. Этот недостаток устраняется 209 применением метода аналитического выравнивания для анализа основной тенденции. Аналитическое выравнивание предполагает представление уровней данного ряда динамики в виде функции времени - y t =f(t). Для отображения основной тенденции развития явлений во времени применяются различные функции: полиномы степени, экспоненты, логистические кривые и другие виды. Полиномы имеют следующий вид: полином первой степени: t a a y t 1 0 + = полином второй степени: 2 2 1 0 t a t a a y t + + = полином третьей степени: 3 3 2 2 1 0 t a t a t a a y t + + + = полином n-ой степени: n n t a t a t a a y t + + + + = 2 2 1 0 Здесь , , 1 0 а а 2 а , n а - параметры полиномов, t - условное обозначение времени. В статистической практике параметры полиномов невысокой степени иногда имеют конкретную интерпретацию характеристик динамического ряда. Так, параметр 0 а трактуется как характеристика средних условий ряда динамики, параметры 1 а , 2 а , 3 а - как изменения ускорения. В статистике выработано правило выбора степени полинома модели развития, основанное на определении величин конечных разностей уровней динамических рядов. Согласно этому правилу полином первой степени (прямая) применяется как модель такого ряда динамики, у которого первые разности (абсолютные приросты) постоянны, полиномы второй степени - для отражения ряда динамики с постоянными вторыми разностями (ускорениями), полиномы третьей степени - с постоянными третьими разностями и т.д. Рассмотрим «технику» выравнивания ряда динамики по прямой (полином первой степени): t a a y t 1 0 + = . Параметры , , 1 0 а а согласно методу наименьших квадратов находятся решением следующей системы нормальных уравнений: ∑ ∑ ∑ = + ∑ ∑ = + , ; 2 1 0 1 0 yt t a t a y t a n a (1.10.14) где у – фактические (эмпирические) уровни ряда; t – время (порядковый номер периода или момента времени). 210 Расчет параметров значительно упрощается, если за начало отсчета времени (t=0) принять центральный интервал (момент). При четном числе уровней значения t – условного обозначения времени будут такими: …-5, -3, -1, +1, +3, +5,… При нечетном числе уровней значения устанавливаются по- другому: …-3, -2, -1, 0, +1, +2, +3, … В обоих случаях ∑ t =0, так что система нормальных уравнений (1.10.14) принимает вид: ∑ ∑ = ∑ = , ; 2 1 0 t a yt n a y (1.10.15) Из первого уравнения n y а ∑ = 0 (1.10.16), из второго - ∑ ∑ = 2 1 t yt а (1.10.17). Проиллюстрируем на примере динамического ряда производства цемента в экономическом регионе за 1991 – 2002 гг. (см. табл. 1.10.4, расчетные значения – табл. 1.10.6) выравнивание ряда динамики по прямой. Для выравнивания данного ряда используем линейную трендовую модель – уравнение прямой: t a a y t 1 0 + = . В нашем примере n = 12 – четное число. Для упрощения расчетов обозначим время так, чтобы начало его отсчета приходилось на середину рассматриваемого периода. Таблица 1.10.6 Выравнивание по прямой ряда динамики производства цемента 211 Параметры 1 0 а и а искомого уравнения прямой исчислим по формулам (1.10.16) и (1.10.17). Из таблицы 1.10.6 находим: ∑ t y = 25315 ; ∑ t y i = 5599 ; ∑ 2 t = 572, Откуда т млн n y а 6 , 2109 12 25315 0 = = ∑ = ; 78 , 9 572 5599 2 1 т млн t yt а = = ∑ ∑ = Уравнение прямой, представляющее собой трендовую модель искомой функции, будет иметь вид: t y t 78 , 9 6 , 2109 + = Подставив в полученное уравнение прямой значения t из графы 2 табл. 1.10.6, получим теоретические уровни (см. графу 5 табл. 1.10.6). Если расчеты выполнены правильно, то i y ∑ = ∑ t y . В нашем примере i y ∑ = ∑ t y = 25315. Следовательно, значения уровней выравненного ряда найдены верно. Полученное уравнение показывает что, несмотря на значительные колебания в отдельные годы, наблюдается тенденция увеличения производства цемента: с 1991 по 2002 гг. производство цемента в среднем возрастало на 9,78 млн. т в год. Фактические и расчетные значения производства цемента представлены в виде графика (см. рис. 1.10.1). Годы Производство цемента, млн. т ( i y ) t 2 t t y i t y 2 ) ( i i t y у − А 1 2 3 4 5 6 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 1942 2016 1986 2110 2042 2210 2112 2218 2196 2201 2181 2101 -11 -9 -7 -5 -3 -1 1 3 5 7 9 11 121 81 49 25 9 1 1 9 25 49 81 121 -21362 -18144 -13902 -10550 -6126 -2210 2112 6654 10980 15407 19629 23111 2002,02 2021,58 2041,14 2060,7 2080,26 2099,82 2119,38 2138,94 2158,5 2178,06 2197,62 2217,18 3602,4004 31,1364 3040,4196 2430,49 1463,8276 12139,6324 54,4644 6250,4836 1406,25 526,2436 276,2244 13497,7924 Сумма 25315 0 572 5599 25315 44719,3648 212 Рис. 1.10.1 Фактические и выравненные годовые уровни производства цемента Соединив точки, построенные по фактическим данным, получим ломаную линию, на основании которой затруднительно вынести суждение о характере общей тенденции в изменении производства цемента. Тенденция роста производства цемента в изучаемом периоде отчетливо проявляется в результате построения выравненной прямой t y t 78 , 9 6 , 2109 + = 1.10.4 Методы выявления сезонной компоненты При рассмотрении квартальных или месячных данных многих социально-экономических явлений часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не изменяются за длительный период времени. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также ряда многочисленных разнообразных факторов, которые частично являются регулируемыми. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонных колебаний» или «сезонных волн», а динамический ряд в этом случае называют тренд- сезонным, или просто сезонным рядом динамики. Сезонные колебания характеризуются специальным показателями, которые называются индексами сезонности ( S I ). Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются 213 процентные отношения фактических внутригодовых уровней к постоянной или переменной средней. Для выявления сезонных колебаний обычно берут данные за несколько лет, распределенные по месяцам. Данные за несколько лет (обычно не менее трех) берутся для того, чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года. Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания. Для каждого месяца рассчитывается средняя величина уровня, например, за три года ( i y ), затем из них рассчитывается среднемесячный уровень для всего ряда ( у ) и в заключение определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, то есть: % , 100 ⋅ = y y i S I (1.10.18) Если же ряд динамики содержит определенную тенденцию в развитии, то прежде чем вычислить сезонную волну, фактические данные должны быть обработаны так, чтобы была выявлена общая тенденция. Обычно для этого прибегают к аналитическому выравниванию ряда динамики. При использовании способа аналитического выравнивания ход вычислений индексов сезонности следующий: по соответствующему полиному вычисляются для каждого месяца (квартала) выровненные уровни на момент времени (t); вычисляются отношения фактических месячных (квартальных) данных ( i y ) к соответствующим выровненным данным ( i t у ): % , 100 ⋅ = t y y i I ; находятся средние арифметические из процентных соотношений, рассчитанных по одноименным периодам в процентах ( ) n n i I I I I I ÷ + + + + = 3 2 1 , где n – число одноименных периодов. В общем виде формулу расчета индекса сезонности данным способом можно записать так: n у y i i t S I ∑ ÷ = ) ( (1.10.19) 214 Расчет заканчивается проверкой правильности вычислений индексов, так как средний индекс сезонности для всех месяцев (кварталов) должен быть 100 процентов, то сумма полученных индексов по месячным данным равна 1200, а сумма по четырем кварталам - 400. 1.10.5 Элементы прогнозирования. Интерполяция и экстраполяция в рядах динамики Необходимым условием регулирования рыночных отношений является составление надежных прогнозов развития социально– экономических явлений. Важное место в системе методов прогнозирования занимают статистические методы. Применение прогнозирования предполагает, что закономерность развития, действующая в прошлом (внутри ряда динамики), сохранится и в прогнозируемом будущем, то есть прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективой и в прошлое - ретроспективой. Обычно, говоря об экстраполяции рядов динамики, подразумевает чаще всего перспективную экстраполяцию. Применение экстраполяции в прогнозировании базируется на следующих предпосылках: развитие исследуемого явления в целом описывается плавной кривой; общая тенденция развития явления в прошлом и настоящем не претерпет серьезных изменений в будущем. Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения, а также как точно удастся охарактеризовать выявленную в прошлом закономерность. Экстраполяцию следует рассматривать как начальную стадию построения окончательных прогнозов. В зависимости от того, какие принципы и какие исходные данные положены в основу прогноза, можно выделить следующие элементарные методы экстраполяции: среднего абсолютного прироста, среднего темпа роста и экстраполяция на основе выравнивания рядов по какой- либо аналитической формуле. Прогнозирование по среднему абсолютному приросту может быть выполнено в том случае, если есть уверенность считать общую тенденцию линейной, то есть метод основан на предположении о равномерном изменении уровня (под равномерностью понимается стабильность абсолютных приростов). Для нахождения интересующего нас аналитического выражения тенденции на любую дату t необходимо определить средний абсолютный 215 прирост и последовательно прибавить его к последнему уровню ряда столько раз, на сколько периодов, экстраполируется ряд, то есть экстраполяцию можно сделать по следующей формуле: t y у n t n ⋅ ∆ + = + (1.10.20) где t n у + - экстраполируемый уровень, (n+t) - номер этого уровня (года); n - номер последнего уровня (года) исследуемого периода, за который рассчитан ∆ ; t - срок прогноза (период упреждения); ∆ - средний абсолютный прирост. Так, по данным табл. 1.10.6, на основе исчисленного ранее уравнения t y t 78 , 9 6 , 2109 + = , экстраполяцией при t=13 можно определить ожидаемое производство цемента в 2003 г., млн. т: 7, 2236 13 78 ,9 6, 2109 = ⋅ + = t y Прогнозирование по среднему темпу роста можно осуществлять в случае, когда есть основание считать, что общая тенденция ряда характеризуется показательной (экспоненциальной) кривой. Для нахождения тенденции в этом случае необходимо определить средний коэффициент роста, возведенный в степень, соответствующую периоду экстраполяции, то есть по формуле: t t n T n y у ⋅ = + (1.10.21) где n y - последний уровень ряда динамики; t - срок прогноза; T - средний коэффициент роста. Если же ряду динамики свойственна иная закономерность, то данные, полученные при экстраполяции на основе среднего темпа роста, будут отличаться от данных, полученных другими способами экстраполяции. Рассмотренные способы экстраполяции тренда, будучи простейшими, в то же время являются и самыми приближенными. Поэтому наиболее распространенным методом прогнозирования является аналитическое выражение тренда. При этом для выхода за границы исследуемого периода достаточно продолжить значения независимой переменной времени (t). 216 При таком подходе к прогнозированию предполагается, что размер уровня, характеризирующего явление, формируется под воздействием множества факторов, причем не представляется возможным выделить отдельно их влияние. В связи с этим, ход развития связывается не с какими-либо конкретными факторами, а с течением времени, то есть y=f(t). Поэтому целесообразно определение доверительных интервалов прогноза. Величина доверительного интервала определяется следующим образом: t t у t n ε α σ ⋅ ± + (1.10.22) где α t - коэффициент доверия по распределению Стьюдента; m n y у i i t t − ∑ − = 2 ) ( ε σ - остаточное среднее квадратическое отклонение от тренда, скорректированное по числу степеней свободы (n-m); n - число уровней ряда динамики; m - число параметров адекватной модели тренда (для уравнения прямой m=2). Рассчитаем прогнозируемые доверительные интервалы производства цемента на 2003 г. Если n=12 и m=2, то число степеней свободы равно 10. Тогда при доверительной вероятности, равной 0,95 (то есть при уровне значимости случайностей α =0,5), коэффициент доверия α t =2,306 (по таблице Стьюдента), ∑ − 2 ) ( i i t y у =44719,3648 (см. табл. 1.10.6). Тогда 873 , 66 2 12 3648 , 44719 ± = − = t ε σ Зная точечную оценку прогнозируемого значения производства цемента 7 , 2236 = t y млн. т, определяем вероятностные границы интервала: 873 , 66 306 , 2 7 , 2236 873 , 66 306 , 2 7 , 2236 2003 ⋅ + ≤ ≤ ⋅ − у , отсюда 91 , 2390 49 , 2082 2003 ≤ ≤ у 217 Следовательно, с вероятностью 0,95, можно утверждать, что производство цемента в 2003 г. не менее чем 2082,49, но и не более чем 2390,91 млн. т. При анализе рядов динамики иногда приходится прибегать к определению некоторых неизвестных уровней внутри данного ряда динамики, то есть к |