Главная страница

Учебное пособие Нижний Новгород 2010


Скачать 1.29 Mb.
НазваниеУчебное пособие Нижний Новгород 2010
Дата12.01.2023
Размер1.29 Mb.
Формат файлаpdf
Имя файла4775.pdf
ТипУчебное пособие
#883803
страница4 из 6
1   2   3   4   5   6
моделью данных,
а функции f называются
функциями
прогнозирования.
В соответствии с этой моделью данных прогнозное значение Y
0
вычисляется как значение функции прогнозирования
)
X
,...,
X
,
X
;
(
2 1
m
t
f
при аргументах т.е. принимается, что
0 20 10 0
,...,
,
,
m
x
x
x
t
)
,...,
,
;
(
0 20 10 0
0
m
x
x
x
t
f
Y
=
.
Функция прогнозирования f имеет и другие названия: объясняющая функция, кривая подгонки (если функция зависит от одного фактора), функция регрессии (если для вычисления ее параметров используются методы регрессионного анализа).
Будем использовать название
функция
прогнозирования как наиболее общее, подчеркивающее цель построения этой функции.

34
В теории прогнозирования, если таблица данных и функция f не содержат в явном виде аргумента времени t, то такие модели данных называются
причинно-следственными
или
казуальными.
Если же таблица данных и функция f не содержат аргументов-факторов, а функция f зависит только от времени t, то такие модели данных называются
моделями
временных рядов.
Методы прогнозирования, используемые в этих двух типах моделей данных, практически идентичны, но обоснование их применения различно. В моделях обоих типов предполагается, что значения переменной Y порождаются неким процессом или системой. В казуальных моделях изменения системы
(процесса), которые выражаются в изменении значений факторов, приводят к изменению значений переменной Y. Поэтому, если функция f адекватно описывает поведение системы, то с достаточной точностью можно спрогнозировать значение переменной Y при новых значениях факторов. В казуальных моделях основная проблема заключается в подборе такой функции
f, которая наиболее адекватно отображала бы реальную систему.
Модели временных рядов рассмотрим более подробно.
3.2. Модели временных рядов
В моделях временных рядов предполагается, что процесс, порождающий значения Y, является стационарным случайным процессом. Это означает стабильность вероятностных характеристик данного процесса как в прошлом, так и в будущем. Характер поведения переменной Y в будущем совпадает (статистически) с характером ее поведения в прошлом, и на этом основании можно рассчитать искомое прогнозное значение. Если предположение о стационарности случайного процесса не выполняется, то методы вычисления прогнозного значения резко усложняются.
С моделью временного ряда связано еще несколько понятий, которые широко используются в прогнозировании. Во-первых, это понятие горизонта
прогнозирования и связанное с ним понятие шага, или периода,

35
прогнозирования. Временные данные в таблице данных обычно представлены с определенным шагом времени, например, с шагом в один час, один день, одну неделю, один месяц, квартал или год.

Этот временной шаг, с которым представлены данные в таблице данных, и называется
шагом
или
периодом прогнозирования.

Горизонтом прогнозирования
называется количество периодов прогнозирования, на которые вперед (в будущее) будет составляться прогноз. Горизонт прогнозирования определяет краткосрочные
(несколько периодов), среднесрочные (около десяти периодов) и
долгосрочные (более десяти периодов) прогнозы.
Во-вторых, модели временных рядов порождают понятия тренда и
сезонных изменений.

Трендом
называется общая тенденция изменения данных в зависимости от времени.

Сезонные изменения
связаны с некоторыми повторяющимися через определенные временные интервалы факторами, периодически влияющими на процесс (систему). Термин «сезон» является
«техническим» термином и никак не связан с погодными или годовыми сезонами. Как правило, сезон совпадает с периодом прогнозирования.
В зависимости от типа взаимовлияния тренда и сезонных изменений различают
аддитивную модель,
когда сезонные изменения добавляются к тренду, т.е. принимается, что
)
(
S
)
(
T
)
(
t
t
t
f
+
=
(здесь и далее через Т и S будем обозначать трендовую и сезонные составляющие функции f), и
мультипликативную
модель,
где тренд и сезонные изменения перемножаются, т.е. )
(
S
)
(
T
)
(
t
t
t
f
×
=
. В моделях экономических данных чаще используется мультипликативная модель, поскольку замечено, что
относительные величины сезонных изменений сохраняют свои значения, несмотря даже на резко изменившиеся внешние условия.
На практике отличить аддитивную модель от мультипликативной можно по характеру сезонных изменений. Аддитивной модели присуща практически

36
постоянная амплитуда (размах) сезонных изменений, тогда как в мультипликативной она возрастает или убывает вместе с возрастанием или убыванием значений тренда.
Итак, функция прогнозирования будет иметь вид:
)
(
S
)
X
,...,
X
,
X
;
(
T
)
X
,...,
X
,
X
;
(
2 1
2 1
t
t
t
f
m
m

=
или
)
(
S
)
X
,...,
X
,
X
;
(
T
)
X
,...,
X
,
X
;
(
2 1
2 1
t
t
t
f
m
m
+
=
Теперь поговорим о факторах
, влияющих на трендовую
m
X
,...,
X
,
X
2 1
составляющую функции прогнозирования. Включать тот или иной фактор в модель данных – это дело выбора. Чтобы исключить какой-либо фактор из модели данных, достаточно вычеркнуть из таблицы данных столбец со значениями этого фактора. Чтобы включить новый фактор в модель, необходимо иметь значения этого фактора, «привязанные» к другим данным. С одной стороны, исключить из модели все факторы (т.е. перейти к «чистой» модели временного ряда) нежелательно, поскольку это настолько «обеднит» модель, что она, наверняка, будет плохо отображать реальную ситуацию.
Большое количество факторов порождает свои проблемы, в основном, вычислительного характера. Если их больше количества значений переменной
Y, то, как правило, параметры функции прогнозирования f
k
b
b
b
,...,
,
2 1
определяются неоднозначно. Кроме того, при большом количестве факторов может возникнуть проблема, которая называется мулътиколлинеарностью. Это означает существование сильной линейной (статистической) зависимости между факторами. Наличие мультиколлинеарности резко усложняет вычисление параметров функции прогнозирования, и эту проблему принято устранять.
Существуют методы, которые позволяют определить значимые факторы, т.е. выбрать те факторы, от которых действительно зависит переменная Y. Выявить значимые факторы – одна из основных задач при построении модели данных.

37
3.3. Алгоритм прогнозирования
Алгоритм прогнозирования – это, прежде всего, алгоритм построения модели данных, где вычисление прогнозного значения является заключительным этапом построения модели. Этот алгоритм можно описать в виде следующей последовательности этапов.
1. Подготовка данных.
Этап предварительного анализа имеющихся данных: анализ резко выделяющихся наблюдений, восстановление пропущенных данных, исключение факторов, явно не влияющих на прогнозируемую переменную Y.
2. Выделение трендовой составляющей
– подбор функций, аппроксимирующих трендовую компоненту, и вычисление параметров этих функций, отбор значимых факторов.
3. Выделение сезонной составляющей
– вычисление сезонных коэффициентов по разностям между фактическими значениями переменной
Y и вычисленным значениям тренда.
4. Анализ остатков и отбор моделей.
После построения функции прогнозирования (модели данных) проводится статистический анализ остатков – разностей между значениями переменной Y и вычисленным значением функции прогнозирования. На основе анализа остатков отбираются одна или несколько моделей данных, наиболее адекватно представляющих исходные данные.
5. Вычисление прогнозного значения.
На основе отобранных функций прогнозирования вычисляются прогнозные значения.
На практике эти этапы могут перемежаться или накладываться друг на друга. После каждого этапа необходимо иметь законченный результат:
• после 1-го этапа – набор данных, готовый к дальнейшей обработке;
• после 2-го этапа – одну или несколько моделей трендовой составляющей;
• после 3-го этапа – сезонные коэффициенты, описывающие сезонные изменения;

38
• после 4-го этапа – одну или несколько моделей данных;
• после 5-го этапа – один или несколько наборов прогнозных значений и по возможности доверительных интервалов для них.
Прогнозирование – это умение строить качественные и адекватные модели данных. Построение качественных и адекватных моделей данных требует, во-первых, хорошего знания той предметной области, отображением которой являются имеющиеся наборы данных, а во-вторых, высокого уровня знаний математической статистики и умения применять их на практике.
В пособии изложен алгоритмическийподход к описанию методов построения моделей и прогнозирования. Далее подробно описаны средства
Excel, которые наиболее часто применяются в прогнозировании.

39
4. Средства Excel для прогнозирования
Качественное прогнозирование требует полного анализа данных и построения адекватной модели данных. Однако существуют средства Excel, которые можно использовать для быстрого предварительного прогнозирования, без глубокого анализа данных, хотя в этом случае нельзя гарантировать качественный прогноз. Можно построить и доверительные интервалы для вычисленного прогнозного значения. Для выделения сезонной составляющей функции прогнозирования в Excel нет встроенных средств, поэтому она также не будет учитываться при составлении быстрого прогноза.
В качестве исходных данных используем данные из таблицы 3 [4].
Задача прогнозирования заключается в том, чтобы вычислить прогнозные значения месячных объемов продаж на июль-декабрь 2007 года при условии, что сохранятся существующие тенденции уменьшения производственных затрат и возрастания расходов на рекламу. Это условие означает, что надо также сделать прогноз на эти месяцы значений производственных затрат и затрат на рекламу.
Таблица данных – объемы продаж по месяцам
Т а б л и ц а 3

п/п
Месяц и год
(время t)
Производственные
затраты тыс. руб.
(фактор Х
1
)
Затраты на
рекламу тыс.
руб.
(фактор Х
2
)
Объемы продаж
тыс. руб.
(переменная Y)
1 январь 2005 905,8 199,8 1282,0 2 февраль 2005 902,5 211,5 1292,7 3 март 2005 903,0 206,8 1228,9 4 апрель 2005 889,8 225,7 1392,6 5 май 2005 889,8 219,0 1647,3 6 июнь 2005 892,8 235,7 1672,9 7 июль 2005 888,3 231,3 1660,5 8 август 2005 875,8 241,1 2011,7 9 сентябрь 2005 883,9 238,1 2351,9 10 октябрь 2005 875,1 248,1 2513,9 11 ноябрь 2005 871,6 256,9 2468,5 12 декабрь 2005 879,8 251,9 2746,2 13 январь 2006 868,2 273,1 1942,7 14 февраль 2006 866,3 264,5 1901,1 15 март 2006 862,1 267,1 1971,6

40
Окончание табл. 3

п/п
Месяц и год
(время t)
Производственные
затраты тыс. руб.
(фактор Х
1
)
Затраты на
рекламу тыс.
руб.
(фактор Х
2
)
Объемы продаж
тыс. руб.
(переменная Y)
16 апрель 2006 866,6 282,9 1989,1 17 май 2006 862,5 287,5 2139,2 18 июнь 2006 863,9 286,3 2474,2 19 июль 2006 858,5 285,3 2393,6 20 август 2006 861,7 304,1 2990,1 21 сентябрь 2006 854,6 302,2 3190,3 22 октябрь 2006 847,0 309,6 3400,4 23 ноябрь 2006 854,4 310,0 3399,5 24 декабрь 2006 842,5 305,9 3793,9 25 январь 2007 842,1 316,0 2584,9 26 февраль 2007 844,2 302,6 2451,7 27 март 2007 843,6 314,3 2666,0 28 апрель 2007 845,2 311,1 2611,0 29 май 2007 833,2 317,9 2731,8 30 июнь 2007 843,1 329,7 2983,8
4.1. Графические средства получения прогнозов
Средство построения диаграмм и графиков Excel автоматически строит линии тренда и автоматически рассчитывает прогнозные значения. Покажем, как это делается. Это возможно только в том случае, когда прогнозируемая переменная Y зависит от одного фактора, в роли которого выступает время.
Для графического прогнозирования сначала строится диаграмма или график по значениям прогнозируемой переменной Y. В нашем примере построим точечный график объемов продаж в зависимости от времени.
Линию тренда нельзя добавить в объемную, лепестковую, круговую и кольцевую диаграммы, а также в диаграмму с накоплением.

41
Рис. 4. График прогнозируемой переменной
Чтобы по этому ряду данных построить линию тренда, выполните такие действия.
1. Щелкните на диаграмме, чтобы выделить ее.
2. Выберите команду Работа с диаграммами
МакетЛинии тренда
Дополнительные параметры линии тренда, чтобы открыть диалоговое окно Формат линия тренда.
3. В диалоговом окне Формат линии тренда выберите тип линии тренда
(рис. 5). Для выбора предоставляются следующие типы линии тренда.

Экспоненциальная
. Уравнение линии экспоненциального тренда имеет вид
, с и b – вычисляемые параметры линии тренда.
Y
X
b
ce
=

Линейная
. Линейная линия тренда – это прямая, которая описывается уравнением
b
m
+
= X
Y
, где X – независимая переменная (фактор), т и b – вычисляемые параметры прямой
(параметр т определяет наклон прямой, параметр b – точку пересечения прямой с осью Y).

42

Логарифмическая
. Уравнение логарифмической линии тренда имеет вид
b
c
+
=
X)
ln(
Y
, где с и b – вычисляемые параметры линии тренда.

Полиномиальная
. Уравнение полиномиальной линии тренда имеет вид
b
x
, где
1 2
и b
c
x
c
x
c
x
c
n
n
n
n
+
+
+
+
+
=


1 1
2 2
1 1
Y
1
,
,...,
,
c
c
c
c
n
n

– вычисляемые параметры линии тренда. Здесь же на вкладке Тип счетчик Степень позволяет задать степень полинома п – это может быть целое число от 2 до 6.

Степенная
. Уравнение линии степенного тренда имеет вид
,
X c и b – вычисляемые параметры линии тренда.
Y
b
c
=

Линейная фильтрация.
При выборе этой опции происходит сглаживание данных методом скользящего среднего.
Если ряд данных содержит нулевые или отрицательные значения, то линии тренда
Экспоненциальная
и
Степенная
будут недоступны.
4.
В диалоговом окне
Формат линии тренда
также предлагается
• определить название линии тренда, которое будут включено в легенду,
• задать количество периодов, на которые будут прогнозироваться данные (вперед и назад).
Три дополнительные опции позволяют отобразить на диаграмме
• пересечение линии тренда с осью Y (опция
Пересечение
кривой с осью Y в точке
);
• уравнение линии тренда (опция
Показывать уравнение на
диаграмме
);
• значение коэффициента детерминации
2
R ,определяющее достоверность аппроксимации (опция
Поместить на
диаграмму величину достоверности аппроксимации
(R^2)
).

43 5.
После того как выбран тип линии тренда и сделаны другие установки, щелкните на кнопке
Закрыть
, чтобы получить линию тренда и прогноз на указанное число периодов.
Рис. 5. Выбор параметров линии тренда
График линии тренда для нашего примера показан на рис. 6. В качестве аппроксимирующей функции выбрана степенная функция. Прогноз сделан на шесть месяцев вперед.

44
Рис. 6. Степенная линия тренда
Чтобы просмотреть все возможные линии тренда, постройте сначала одну из них, задав все необходимые параметры (количество периодов для прогноза, название, вывод уравнения линии тренда и значения коэффициента детерминации
2
R ). Затем, щелкните правой конкой мыши на линии тренда и выберите в контекстном меню команду
Формат линии тренда
, в появившемся диалоговом окне можно выбрать другой тип линии тренда. При этом все ранее сделанные установки переносятся на новую линию тренда. Перебрав все возможные линии тренда, остановите выбор на той, для которой коэффициент детерминации имеет наибольшее значение.
Коэффициент детерминации
2
R характеризует степень близости линии тренда к исходным данным. Он может принимать значения от 0 до 1. Чем больше его значение, тем лучше линия тренда аппроксимирует исходные данные.
Какие же прогнозные значения мы получили? Мы имеем прогноз и можем увидеть, как ведет себя прогнозируемая переменная, но числовые значения прогноза неизвестны.

45
Определить числовые значения можно визуально из графика линии тренда, если увеличить размер области построения диаграммы и сделать погуще линии сетки, как показано на рис. 7. В нашем примере получаем, что на
31-й период (июль 2007 г.) прогнозное значение продаж составит примерно
2980 тыс. руб., на 32-й период (август 2007 г.) примерно 3010 тыс. руб., и т.д.
Обратите внимание на то, что при построении тренда используются не числа, соответствующие датам, а последовательность целых чисел, обозначающих номер по порядку значения ряда данных.
Рис. 7. Получение числовых значений прогноза
Более точные значения прогнозируемой переменной можно получить, если воспользоваться приведенным уравнением линии тренда. В нашем примере оно имеет вид:
0,3068 1040,3X
Y
=

46
Подставляя поочередно вместо X номера периодов 31, 32, ..., 36, получим искомые прогнозируемые значения.
Эти вычисленные значения показаны на рис. 8 в диапазоне ячеек E2:E7.
Для их вычисления в диапазон D2:D7 сначала были введены числа от 31 до 36, затем в ячейку E2 была введена формула, которая показана на рис. 8 в строке формул, далее эта формула была скопирована вниз на диапазон E3:E7. Этот прогноз запишем в отдельную таблицу (табл. 4). Коэффициент детерминации
2
в данном случае равен
1   2   3   4   5   6


написать администратору сайта