курсовая по статистической аналитике. Курсовая работа по дисциплине Методы прогнозирования и анализ рынка
Скачать 2.07 Mb.
|
Построение моделей трендовой составляющейТренд – это аналитическая функция, которая описывает тенденцию изменения явления и связывает единым законом развития все последующие уровни ряда динамики. Трендовая составляющая t (τ) отражает устойчивую и долговременную тенденцию временного ряда. Таким образом, возникает задача выделения тренда, т.е. построения оценки для функции t(τ) (или оценок (τi) для значений t (τi)) по заданной временной выборке {τi, yi}. При этом предполагается, что остальные составляющие p(τ), s(τ) временного ряда отсутствуют. Полагая время τ независимой переменной, оценим функцию t (τ), используя метод парной регрессии, который основан на аддитивной модели временного ряда: Y(τi) = t(τi) + ε(τi), где случайные величины ε(τi) удовлетворяют условиям Гаусса–Маркова: 1) дисперсии δi – конечные, одинаковые, независимые от измерений и таковы, что M(ε(τi)) = 0, M(ε(τi), ε(τj)) = , 2) случайные величины ε(τi) имеют нормальное распределение N (0, δ2). Для того, чтобы определить характер тренда, необходимо выбрать вид функции t(τ). Предварительно мы анализируем графическое изображение ряда, т.е. строим диаграмму рассеивания по точкам {τi, yi}. С помощью диаграммы рассеивания можно сделать выбор вида функции из представленных ниже. Линейная функция t(τ) = β0 + β1τ используется для представления процессов с постоянной скоростью изменения. Полиномиальная t(τ) = β0 + β1τ + β2τ2+ β3τ3 используется для представления процессов, в которых с течением времени тенденция меняется с возрастающей на убывающую (или наоборот). После выбора вида функции t(τi) построим уравнение регрессии (τ), зависящее от коэффициентов b0, b1,…,bk, которые являются оценками коэффициентов β0, β1,…, βk функции тренда t(τ). Вычислим коэффициенты b0, b1,…,bk по методу наименьших квадратов, минимизируя отклонение расчетных значений от фактических: F(b0, b1,…,bk) = . Для этого нужно найти частные производные первого порядка по каждому из коэффициентов bi, i=, приравнять к нулю и решить полученную систему из k уравнений. Получив коэффициенты b0, b1,…,bk, примем составленное уравнение регрессии (τ) в качестве оценки для функции тренда t(τ), которая может быть использована для дальнейшего анализа временного ряда или его прогнозирования. В результате визуального анализа диаграммы рассеивания, представленной на рисунке 2.1, для определения характера тренда выбраны линейная и полиномиальная (3–ей степени) функции. Рисунок 2.1 – Диаграмма рассеяния С помощью встроенных функций Exсel найдем коэффициенты уравнений регрессии. Таким образом, мы получаем следующие модели трендовой составляющей: линейная функция (τ) =-0,0093τ +102,28; полиномиальная функция (τ) = -0,00000003τ3 + 0,00007τ2–0,0228τ+102,78. Выбор адекватной модели трендовой составляющейНезависимо от вида и способа построения трендовой составляющей вопрос о ее выборе и возможности применения в экономико–математической модели может быть решен только после установления адекватности и точности линии тренда. Построенная модель является адекватной, если она соответствует данным наблюдения. Проверка адекватности модели основывается на анализе ряда остатков где расчетное значение неслучайной составляющей временного ряда. Трендовая составляющая является адекватной, если выполнены все условия, что остатки: являются случайными; имеют равное нулю математическое ожидание; независимы между собой. Случайность ряда остатков проверяется по критерию серий. Предварительно выбирается медиана упорядоченного по неубыванию ряда остатков. Каждому элементу ряда остатков ставится в соответствие знак «+», если , и знак «–», если . Непрерывно идущую последовательность одинаковых знаков принято называть серией. Определяется максимальная длина серии и число серий V. Остатки считаются случайными на уровне значимости 0,05, если одновременно выполняются два условия Для линейной модели 11,08118 1911,0811899,73481 54 т.е. ряд остатков случайный. Для полиномиальной модели 99,73481 53, т.е. ряд остатков случайный. Проверка равенства нулю математического ожидания проводится помощью следующего критерия. Сформулируем две гипотезы тогда если тренд оценен достаточно точно и математическое ожидание остатков равно нулю, то гипотеза считается справедливой. В противном случае неслучайная составляющая содержит систематическую ошибку. Возьмем где . Если попадает в критическую область где , то отвергается с уровнем значимости . определятся через встроенные функции MS Excel. . Расчетные значения по выбранным трендовым моделям представлены в таблице 2.3. Выберем равным 0,05, тогда интервал будет иметь вид: Математическое ожидание равно нулю у обеих рассматриваемых моделей. Таблица 2.3 – Расчетные значения для трендовых моделей
Под независимостью ряда остатков понимается отсутствие в нем автокорреляции, т. е. отсутствует зависимость каждого значения ряда от предыдущих значений. Для проверки ряда остатков на отсутствие автокорреляции уровней остатков используется критерий Дарбина–Уотсона. Этот критерий основан на идее, что корреляция между сохраняется в невязках Для проверки критерия необходимо рассчитать величину представляющую собой отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Между критерием Дарбина–Уотсона d и коэффициентом автокорреляции остатков первого порядка имеет место следующее соотношение: Коэффициент автокорреляции первого порядка определяется по формуле Отсюда следует, что . При положительной автокорреляции:. При отрицательной автокорреляции: . При отсутствии автокорреляции: . Соотношения между критерием Дарбина–Уотсона и коэффициентом автокорреляции свидетельствует о том, что с некоторой вероятностью отсутствует автокорреляция. Для более точного определения, какое значение d свидетельствует об отсутствии автокорреляции, а какое о ее наличии, построена таблица критических точек распределения Дарбина–Уотсона. По этой таблице для заданного уровня значимости , числа наблюдений и количества объясняющих переменных определяются значения нижней и верхней границы. Вывод о наличии или отсутствии автокорреляции остатков принимается в зависимости от того в какой промежуток попадает значение критерия d: – остатки имеют положительную автокорреляцию; – зона неопределенности; – автокорреляция отсутствует; – зона неопределенности; – остатки имеют положительную автокорреляцию. Индекс детерминации Оценка точности модели тенденции заключается в оценке близости модельных значений тенденции к фактическим уровням ряда и осуществляется с помощью вычисления индекса детерминации. Введем суммы: ; , где . Индекс детерминации показывает, какая доля изменения временного ряда обусловлена изменением переменной , характеризует близость уравнения тренда к исходным данным, которые содержат «нежелательную» случайную составляющую . В случае линейного тренда справедливо тождество , где – коэффициент детерминации линейной регрессии: Если , то справедлива гипотеза : нелинейную регрессию можно заменить линейной. Индекс детерминации можно использовать только тогда, когда значения чисел коэффициентов регрессии одинаково. При различных значениях необходимо использовать приведенный индекс детерминации. Приведенный индекс детерминации где m – число коэффициентов в уравнении регрессии. Необходимо посчитать все и выбрать из них наибольшее, которое соответствует лучшему уравнению регрессии. Данные по двум моделям представлены в таблице 2.4. Таблица 2.4 – Автокорреляция остатков и индекс детерминации
Таким образом у линейной и полиномиальной модели присутствует автокорреляция остатков. Приведенный индекс детерминации полиномиальной модели незначительно отличается от соответствующего значения для линейной, поэтому в дальнейшем будем использовать линейную модель. |