лаболаторная работа критерий серии. Лабораторная работа_критерий серий. Лабораторная работа 2 Проверка независимости и стационарности ряда наблюдений (критерий серий)
Скачать 1.18 Mb.
|
Лабораторная работа №2 Проверка независимости и стационарности ряда наблюдений (критерий серий) Цель работы - получить навыки предварительной обработки временных рядов: анализ стационарности. Применения этих навыков при решении практических задач обработки экспериментальных данных с применением ЭВМ. 1. Краткие теоретические сведения. Теория телетрафика использует математический аппарат теории массового обслуживания для анализа и количественной оценки процессов обслуживания информационных потоков в системах распределения информации. Математическая модель системы распределения информации включает следующие три основных элемента: входящий поток вызовов (требований на обслуживание), схему системы распределения информации, дисциплину обслуживания потока вызовов. При этом для решения задач, связанных с качеством обслуживания, на практике, используют стационарный период работы системы и опираются на свойства простейшего потока событий. А.Я. Хинчин сформулировал три условия, при выполнении которых случайный поток однородных событий является простейшим, а именно: стационарность, ординарность и отсутствие последействия: Стационарность – независимость вероятностных характеристик от времени. Отсутствие последействия – вероятность поступления событий в интервале (t 1 , t 2 ) не зависит от событий, произошедших до момента t 1 ; Ординарность – вероятность поступления двух и более событий за бесконечно малый интервал времени t есть величина бесконечно малая, много меньше, чем t. Таким образом, перед тем как применять математический аппарат, необходимо убедиться в том, что поток обладает соответствующими свойствами. Проведем исследование временного ряда на наличие/отсутствие последействия. Для этого будем использовать критерий серий: определяется медиана вариационного ряда Me. образуется последовательность i из плюсов и минусов по следующему правилу: n t Me y если n t Me y если t t i ,..., 2 , 1 , , ,..., 2 , 1 , , (1) если значение t y равно медиане, то это значение пропускается. подсчитывается v(n) - число серий в совокупности i , где под серией понимается последовательность подряд идущих плюсов или минусов. Один плюс или один минус тоже будет считаться серией. Определяется ) ( max n - протяженность самой длинной серии. Проверка гипотезы основывается на том, что при условии случайности ряда протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком маленьким. Поэтому для того, чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей) должны выполняться следующие неравенства (для 5% уровня значимости кр u = 1.96): 1 96 1 1 ( 5 0 ) ( ) 1 ) (lg( 3 3 ) ( max n n n n n (2) 2. Выполнение работы. Пусть задан временной ряд, состоящий из 96 наблюдений. Рисунок 1 – Исходный ряд С помощью критерия серий необходимо определить наличие/отсутствие последействия. Вычислим медиану исходного ряда. Медиана – число, характеризующее выборку, т.е. если взять все элементы множества, то это число ровно делит множество пополам. Одна половина множества (отсортированного по возрастанию или убыванию) равна или больше этого число, а другая меньше или равна этому числу. В Excel можно воспользоваться стандартной функцией: – в любую свободную ячейку вводим =МЕДИАНА (выделяем мышью все числа, закрываем скобку ) и нажимаем Enter. Рисунок 2 – Расчет медианы Образуем последовательность i из плюсов («1») и минусов («0») по правилу (1). В Excel можно воспользоваться стандартной функцией: – в любую свободную ячейку вводим Логический оператор =ЕСЛИ (л огическое_выражение;значение_если_истина;значение_если_ложь ). Рисунок 3 – Пример заполнения первой ячейки Оператор проверяет ячейку C3 и сравнивает ее с медианой 4,273. Это «логическое_выражение». Когда содержимое графы больше 4,273, появляется истинная надпись «1». Нет – «0». При формировании последовательности нужно воспользоваться абсолютной ссылкой. Абсолютные ссылки позволяют зафиксировать строку или столбец (или строку и столбец одновременно), на которые должна ссылаться формула. Для этого перед названием столбца и порядковым номером строки печатаем символ “$”. Или же можно просто после ввода адреса сразу нажать клавишу F4 на клавиатуре (курсор может находиться до, после или внутри координат). Рисунок 4 – Расчет последовательности Подсчитывается v(n) - число серий в совокупности i , где под серией понимается последовательность подряд идущих плюсов («1») или минусов («0»). Для удобства расчетов исходные данные представим в одну таблицу. Подсчитаем количество серий, а также найдем длину серии (количество подряд идущих значений). Для этого воспользуемся формулами подсчитаем длину каждой серии. Формулу разместим в столбце D. =ЕСЛИ(C2<>C3;СЧЁТЕСЛИ($C$2:C3;C2)-СУММЕСЛИ($C$1:C1;C2;$D$1:D1);"") Рисунок 5 - Для работоспособности формулы необходимо, чтобы была заполнена желтая ячейка С98 (иначе, если последняя серия состоит из 1 значения, то формула не произведет подсчет ее длины). Рисунок 6 - В результате получаем длины серий по всем данным Рисунок 7 – Расчет длин серий Находим max - протяженность самой длинной серии. Рисунок 8 – Находим число серий. Рисунок 9 – По формуле 2 находим теоретические значения и сравниваем с полученными значениями: Рисунок 10 – В формулах вместо n (длина временного ряда), вставляем ссылку на ячейку С98 Рисунок 11 – Результат расчета По формуле 2 проверим гипотезу о случайности исходного ряда. Результаты сравнения представлены в таблице 1. Таблица 1 Параметр Эмпирическое значение Теоретическое значение Результат сравнения v(n) 53 38 ИСТИНА max 5 9 ИСТИНА Таким образом, наблюдения независимы. Лабораторная работа №3. Автокорреляция Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Для этого проанализируем автокорреляционную и частную автокорреляционную функции. Автоковариация (т.е. ковариация между уровнями одного и того же ряда) зависит только от того, насколько сильно наблюдения удалены друг от друга во времени, и не зависит от того, находятся ли они в начале или в конце временного ряда. Частная автокорреляционная функция определяет корреляцию между текущим и произошедшим h периодов назад наблюдением после удаления косвенного влияния ( 1 + h - t x , 2 + h - t x , … 1 - t x ) наблюдений. То есть частная автокорреляция измеряет корреляцию между x t и x t-4 без учета влияния x t-1 , x t-2 , x t-3 –го шага. Для оценки функции автокорреляции строится ее график (коррелограмма), значения который лежит в пределах [-1 ÷ 1]. Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Максимальный лаг должен быть не больше (n/4). Коэффициент автокорреляции уровней ряда первого порядка, измеряющий зависимость между соседними уровнями ряда y t и y t-1 , т. е. при лаге 1, рассчитывается по формуле: где Аналогично определяются коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями yt и yt-2 и определяется по формуле: где Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0.1 < rt,t-1< 0.3: слабая; 0.3 < rt,t-1< 0.5: умеренная; 0.5 < rt,t-1< 0.7: заметная; 0.7 < rt,t-1< 0.9: высокая; 0.9 < rt,t-1< 1: весьма высокая. Для расчета значений автокорреляционной функции в MS Excel целесообразно использовать функцию КОРРЕЛ (массив1; массив2). Так, если уровни исходного временного ряда располагаются в ячейках А1:А20, то для расчета коэффициентов автокорреляции можно вводить функции: r1: =КОРРЕЛ (А1:А19; А2:А20) r2: =КОРРЕЛ (А1:А18; А3:А20) r3: =КОРРЕЛ (А1:А17; А4:А20) r4:=КОРРЕЛ (А1:А16; А5:А20) И т. д., постоянно сдвигая диапазон ячеек массива 1-вверх, массива 2- вниз, в зависимости от количества уровней в ряду динамики. Рисунок 12 – Расчет числа сдвигов Так как максимальный лаг должен быть не больше (n/4), то для заданного временного ряда число сдвигов не должно превышать 96/4=24 Вычисляем коэффициенты автокорреляции (рисунок 13). Рисунок 13 – Расчет коэффициентов автокорреляции Так как диапазон первого массива должен уменьшаться на каждом шаге на единицу, при вычислении коэффициентов автокорреляции, как показано на рисунке 13, необходимо вручную поправлять ссылки (А96, А95 и тд.). Для того, чтобы автоматизировать расчет можно воспользоваться функцией = ДВССЫЛ (возвращает ссылку, которая задана текстовой строкой). В отдельных ячейках задаем диапазон массива 1. В ячейке G3 вычисленное значение последней ячейки нашего ряда (так как первое значение исходного ряда в нашем случае располагается в ячейке А2, то необходимо прибавить единицу). Рисунок 14 - Вычисляем коэффициент корреляции первого порядка =КОРРЕЛ(ДВССЫЛ("A"&($F$9)&":A"&($G$9-I2));A3:$A$97) Далее вычисляем остальные коэффициенты корреляции (рисунок 15). Рисунок 15 – По полученным значениям строим коррелограмму (рисунок 16). Рисунок 16 - Вычисленная коррелограмма исходного ряда Так как коррелограмма ряда достаточно быстро затухает с ростом лага, не превышает значения |0,3|, можно сделать вывод, что исходный ряд обладает свойством стационарности. |