Статистика учебник. Тарновская ли. Статистика учебное пособие
Скачать 3.85 Mb.
|
логистическую кривую ,которую называюттакже кривой Перла – Рида. Это возрастающая функция, наиболее часто выражаемая в виде t a a k y 1 Если взять производную данной функции, то можно увидеть, что скорость возрастания логистической кривой в каждый момент времени Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. пропорциональна достигнутому уровню функции и разности между предельным значением k и достигнутым уровнем. Логарифм отношения первого прироста функции к квадрату ее значения (ординаты) есть линейная функция от времени. Кривая Гомперца имеет аналитическое выражение t a a k y 1 0 ⋅ ⋅ = , где a 0 , a 1 – положительные параметры, причем меньше единицы k – асимптота функции. В кривой Гомперца выделяются четыре участка на первом – прирост функции незначителен, на втором – прирост увеличивается, на третьем участке прирост примерно постоянен, на четвертом – происходит замедление темпов прироста и функция неограниченно приближается к значению. В результате конфигурация кривой напоминает латинскую букву S. Логарифм данной функции является экспоненциальной кривой логарифм отношения первого прироста к самой ординате функции – линейная функция времени. На основании кривой Гомперца описывается, например, динамика показателей уровня жизни модификации этой кривой используются в демографии для моделирования показателей смертности и т. д. Конфигурация графика логистической кривой близка графику кривой Гомперца, нов отличие от последней логистическая кривая имеет точку симметрии, совпадающую сточкой перегиба. В соответствии с характером изменения средних приростов выбирается вид кривой роста для исследуемого ряда по табл. На практике при предварительном выборе отбирают три – четыре кривых роста. Выбор наилучшего уравнения тренда осуществляется на основании коэффициентов детерминации 2 R , критерия Фишера и других критериев. Фактический уровень критерия Фишера сравнивается с табличным значением ( ) ( ) , ˆ ; ˆ ; ) 1 ( ) ( 2 2 2 2 2 1 2 2 2 1 факт. n y y n y y k k n F t t ∑ − = σ ∑ − = σ − σ − σ = где k – число параметров уравнения n – число уровней ряда. Если табл. факт. F F > , то уравнение соответствует фактическому временному ряду. Чем больше величина критерия Фишера, тем предпочтительнее данное уравнение тренда. Чем выше 2 R , тем выше вероятность, что динамический ряд описывается данным уравнением. Влияние случайного фактора оценивается как Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ) 1 ( 2 R − . В современных пакетах статистической обработки имеются широкие возможности существенно упростить проведение выбора вида кривой роста. 10.2.4.2. Оценка параметров выбранных кривых На втором этапе осуществляют оценку параметров выбранных кривых Отобранные кривые роста оцениваются методом наименьших квадратов (см. гл. 8). Этот метод приводит к системе нормальных уравнений для определения неизвестных параметров кривых роста. Для полинома первой степени i t t a a y ⋅ + = 1 система нормальных уравнений имеет вид ⎪⎩ ⎪ ⎨ ⎧ = + = + ∑ ∑ ∑ ∑ ∑ , ; 2 1 0 где n – объем исследуемой совокупности (число единиц наблюдения. Число уравнений в системе равно числу искомых параметров. Аналогичная система для полинома второй степени 2 2 1 имеет вид ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ∑ = ∑ + ∑ + ∑ ∑ = ∑ + ∑ + ∑ ∑ = ∑ + ∑ + = = = = = = = = = = = n i i i n i i n i i n i i n i i i n i i n i i n i i n i i n i i n i i t y t a t a t a t y t a t a t a y t a t a na 1 2 1 4 2 1 3 1 1 2 0 1 1 3 2 1 2 1 1 0 1 1 2 2 1 Аналогично строятся системы для полиномов более высоких степеней. Решая эти системы уравнений, находят неизвестные параметры. Пример. Затраты предприятия на рекламу по месяцам года представлены в табл. 10.14. Поданным рассчитаем приросты абсолютных приростов, расчет параметров которых приведен в табл. 10.10. Рассчитанные данные свидетельствуют о фактически стабильных приростах абсолютных приростов. Поэтому тренд может быть выражен полиномом второй степени 2 2 1 0 i i t t a t a a yˆ + + = Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Таблица 10.14 Исходные данные для расчета параметров тренда Месяц, t i Затраты, тыс. де 16 18 36 7 – 3 24 9 27 81 72 216 15 8 4 47 16 64 256 188 752 23 8 5 78 25 125 625 390 1950 31 8 6 116 36 216 1296 696 4176 38 7 7 162 49 343 2401 1134 7938 46 8 8 216 64 512 4096 1728 13824 54 8 9 277 81 729 6561 2493 22437 61 7 ∑ = 45 931 285 2025 15333 6721 51331 275 54 Система нормальных уравнений для расчета параметров приведена выше. Используя данные табл. 10.10, система будет следующей ⎪ ⎩ ⎪ ⎨ ⎧ = + + = + + = + + 51331 15333 2025 285 ; 6721 2025 285 45 ; 931 285 45 9 2 1 0 2 1 0 2 Решая систему, находим параметры 181 , 4 ; 071 , 2 1 0 − = = a a ; . 861 , 3 Получаем уравнение тренда 861 , 3 181 , 4 Сумма фактических затрат равна сумме теоретических значений ∑ ∑ = = = n i n i i i y y 1 1 ˆ , что свидетельствует о правильном выборе трендовой модели. Точечный прогноз затратна рекламу на октябрь месяц составит 36 , 346 100 861 , 3 10 181 , 4 Параметры простой и модифицированной экспоненты и кривых Гомперца и логистической находятся более сложными методами. Предварительно логарифмируют выражение кривой роста и получают линейное выражение, а затем для неизвестных логарифмов параметров составляют систему нормальных уравнений, аналогичную системе для полинома пер Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 свой степени. Решая эту систему, находят логарифмы параметров, а затем и сами параметры модели. 10.2.4.3. Оценка адекватности и точности выбранных моделей На третьем этапе производят оценку адекватности и точности выбранных моделей. Возможность применения трендовых кривых роста в целях прогнозирования экономического явления может быть решена только после установления адекватности ,т. е. их соответствия исследуемому процессу. Трендовая кривая роста t yˆ временного ряда считается адекватной, если правильно отражает изменения временного ряда. Применяется несколько способов оценки – проверка случайности колебаний уровней остаточной последовательности проверка соответствия распределения случайной компоненты нормальному закону распределения – проверка равенства среднего арифметического случайной компоненты нулю – проверка независимости значений уровней случайной компоненты. Проверка случайности колебаний уровней остаточной последо- вательности означает проверку правильности выбора вида тренда. Для исследования случайности отклонений от тренда рассчитывают ошибку прогноза ( ) ˆ 1,2,..., t t t y y t n ε Ошибка изучается с помощью непараметрических критериев. Одним из таких критериев является критерий серий ,основанный на медиане выборки. Ошибки прогноза t ε располагают в порядке возрастания и находят медиану me ε . Сравнивая значения последовательности t ε с me ε , ставят знак плюс, если значение t ε превосходит медиану, и знак минус, если оно меньше медианы в случае равенства сравниваемых величин соответствующее значение t ε опускается. Последовательность подряд идущих плюсов или минусов называется серией Протяженность самой длинной серии через – max k , а общее число серий – через R . Если выполняются следующие неравенства, то модель признается адекватной. Другим критерием для проверки является критерий пиков поворотных точек. Уровень последовательности t ε считается максимумом, если он больше двух рядом стоящих уровней, и минимумом, если он меньше обоих соседних уровней. В обоих случаях t ε считается поворотной точкой. Общее число поворотных точек обозначают через p. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Среднее значение числа точек поворота p и дисперсия 2 p σ выражаются формулами ( ) 2 2 16 29 2 ; 3 90 p n p n − = − σ Критерием случайности является выполнение неравенства 96 , 1 Проверка соответствия распределения случайной компоненты нормальному закону распределения может быть произведена лишь приближенно с помощью показателей асимметрии и эксцесса (см. гл. 6). При нормальном распределении эти показатели равны нулю. Авторы [15–19] предполагают, что отклонения от тренда представляют собой выборку из генеральной совокупности, поэтому определяют выборочные характеристики асимметрии и эксцесса ) 5 )( 3 ( ) 1 ( ) 3 )( 2 ( 24 ; 3 1 1 ; ) 3 )( 1 ( ) 2 ( 6 ; 1 1 2 2 1 2 1 4 3 1 2 Если одновременно выполняются следующие условия , 5 , 1 то распределение случайной компоненты имеет нормальный характер. В современных статистических пакетах (Statistika) имеется набор графических средств, позволяющих судить о том, насколько исследуемое распределение согласуется с нормальным. Известны другие методы проверки нормальности закона распределения случайной величины, например критерий. Критерий численно равен отношению размаха вариации случайной величины R к среднему квад- ратическому отклонению 1 ; ; 2 min Вычисленное значение критерия сравнивается с табличными критическими) нижней и верхней границами данного отношения, и если Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. это значение попадает в интервал между критическими границами, то распределение считается нормальным. Проверка равенства среднего арифметического случайной компоненты нулю осуществляется на основе критерия Стьюдента. Расчетное значение этого критерия задается формулой n S t ε − ε = 0 , где ε – среднее арифметическое значение отклонений ε S – стандартное (среднеквадратическое) отклонение для этой последовательности. Если расчетное значение критерия меньше табличного статистики Стьюдента с заданным уровнем значимости и числом степеней свободы 1 − n , то наблюдается равенство средней арифметической нулю. Проверка независимости значений уровней случайной компоненты, те. проверка отсутствия существенной автокорреляции в остаточной последовательности. Автокорреляция – корреляционная зависимость между значениями остатков ( , ˆ t t t y y − = ε ) за текущий и предыдущий моменты времени. Для оценки автокорреляции используется критерий Дарбина – Уотсона. Расчетное значение этого критерия определяется по формуле ( ) ∑ε ∑ ε − ε = = = − n t t n t t t d 1 2 2 Расчетное значение критерия Дарбина – Уотсона в интервале от 2 до 4 свидетельствует об отрицательной связи в этом случае его надо преобразовать по формуле d' = 4 – в дальнейшем использовать значение d'. Расчетное значение критерия d или сравнивается с верхними нижнимкритическими значениями статистики Дарбина – Уотсона, которые приводятся в таблицах. Если расчетное значение критерия d больше верхнего табличного значения,то автокорреляция отсутствует. Если значение d меньше нижнего табличного значения, то автокорреляция присутствует. Если значение d находится между верхними нижним значениями,включая сами эти значения, то считается, что нет достаточных оснований сделать тот или иной вывод. Вывод об адекватности трендовой модели делается, если всеуказан- ные выше четыре проверки свойств остаточной последовательности дают положительный результат. Для адекватных моделей имеет смысл ставить задачу оценки их точности. Точность модели характеризуется величиной Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. отклонения выхода модели от реального значения моделируемой переменной (экономического показателя. Для показателя, представленного временным рядом, точность определяется как разность между значением фактического уровня временного ряда и его оценкой, полученной расчетным путем с использованием модели, при этом в качестве статистических показателей точности применяются следующие показатели среднее квадратическое отклонение k n y y n t t t − ∑ − = σ =1 2 ) ˆ ( ; средняя относительная ошибка аппроксимации 1 ˆ 1 100 % n t t t t y y n y = − δ Ошибка менее 5 % свидетельствует об удовлетворительном уровне точности, ошибка более 10 % считается очень большой коэффициент сходимости ∑ − ∑ − = ϕ = = n t t n t t t y y y y 1 2 1 2 2 ) ( ) ˆ ( ; коэффициент детерминации 2 и другие показатели. В приведенных формулах п – количество уровней ряда число определяемых параметров модели, t yˆ – оценка уровней ряда по модели, y – среднее арифметическое значение уровней ряда. Чем меньше значения всех характеристик, тем выше точность модели. О качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими. На основании указанных показателей можно сделать выбор из нескольких адекватных трендовых моделей временного ряда наиболее точной, хотя может встретиться случай, когда по некоторому показателю более точна одна модель, а по другому – другая. Пример. Для временного ряда, представленного в табл. 10.11, построена трендовая модель в виде полинома первой степени (линейная модель. Требуется оценить адекватность и точность построенной модели. Первоначально рассчитаем остаточную последовательность (ряд ос Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. татков), для чего из фактических значений уровней ряда вычтем соответствующие расчетные значения по модели остаточная последовательность приведена в табл. Таблица 10.11 t Фактические Расчетные Отклонение Точки пиков % 100 ˆ × × − t t t y y y 1 85 84,4 0,6 – 0,36 – – 0,71 2 81 81,0 0,0 1 0,00 –0,6 0,36 0,00 3 78 77,6 0,4 1 0,16 0,4 0,16 0,49 4 72 74,1 –2,1 1 4,41 –2,5 6,25 2,69 5 69 70,7 –1,7 0 2,89 0,4 0,16 2,46 6 70 67,3 2,7 1 7,29 4,4 19,36 3,86 7 64 63,8 0,2 1 0,04 –2,5 6,25 0,31 8 61 60,4 0,6 1 0,36 0,4 0,16 0,98 9 56 57,0 –1,0 – 1,00 –1,6 2,56 1,79 ∑ 45 636 636,3 –0,3 6 15,5 1 35,26 13,39 Проверку случайности уровней ряда остатков проведем на основе критерия пиков. Точки пиков отмечены в табл. их количество равно шести р = 6). Правая часть неравенства ⎥⎦ ⎤ ⎢⎣ ⎡ σ − > 2 равняется двум, те. это неравенство выполняется. Следовательно, можно сделать вывод, что свойство случайности ряда остатков подтверждается. Результаты предыдущей проверки дают возможность провести проверку соответствия остаточной последовательности нормальному закону распределения. Воспользуемся критерием ( ) 45 , 3 8 51 , 15 1 , 2 Следовательно, критерий попадает в интервал между нижней и верхней границами табличных значений (для n=10 и уровня значимости составляют соответственно 2,7 и 3,7), что позволяет сделать вывод о нормальности распределения. Переходя к проверке равенства среднего арифметического нулю, заметим поданным табл. 10.11, что среднее равно Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 си, следовательно, можно подтвердить выполнение данного свойства, не прибегая к статистике Стьюдента. Для отсутствия автокорреляции вычислим значение критерия Дар- бина – Уотсона. Значение критерия 27 , 2 51 , 15 26 , 35 = = d превышает 2, что свидетельствует об отрицательной автокорреляции. Критерий Дарбина – Уот- сона преобразуем 73 , 1 27 , 2 4 1 = − = d . Данное значение сравниваем с двумя табличными (критическими) 36 , 1 ; 08 , 1 2 1 = = d d . Так как расчетное значение попадает в интервал от 2 d до 2, то делается вывод о независимости отклонений. Из сказанного выше следует, что последовательность отклонений удовлетворяет всем свойствам случайной компоненты временного ряда, те. построенная линейная модель является адекватной. Для характеристики точности модели воспользуемся показателем средней относительной ошибки аппроксимации % 48 , 1 9 29 , 13 = = δ . Полученное значение свидетельствует о высоком уровне точности модели. 10.2.4.4. Расчет точечного и интервального прогнозов Прогноз на основании трендовых моделей содержит два элемента точечный и интервальный прогнозы. Точечный прогноз это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в уравнение выбранной кривой роста величины времени соответствующей периоду прогнозирования. Такой прогноз называется точечным, так как на графике его можно изобразить в виде точки. Очевидно, что точное совпадение фактических данных в будущем и прогностических точечных оценок маловероятно. Поэтому точечный прогноз должен сопровождаться двусторонними границами, те. указанием интервала значений, в котором с достаточной долей уверенности можно ожидать появления прогнозируемой величины. Установление такого интервала называется интервальным прогнозом Интервальный прогноз на базе трендовых моделей осуществляется путем расчета доверительного интервала такого интервала, в котором с определенной вероятностью можно ожидать появления фактического значения прогнозируемого экономического показателя. Расчет доверительных интервалов при прогнозировании с использованием кривых роста опирается на выводы и формулы теории регрессии. Перенесение выводов теории регрессии на временные экономические ряды не совсем правомерно, так |