Задач. Задачи по статистике решённые. Пример задания 1
Скачать 1.07 Mb.
|
Жирным шрифтом в таблице 5.6.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.6.3. Таблица 5.6.3
Далее процесс выделения объектов в кластеры производится аналогично ранее рассмотренным методам. По таблице 5.6.3 находим минимальное расстояние между объектом, включающим в себя 4 и 5 объекты, и 6 объектом, которые объединяем в объект 4,5,6 и составляем таблицу 5.6.4. Таблица 5.6.4
Ввиду того, что расстояния между 1,2 и 3 объектами одинаковые и минимальные, то вначале объединяем 1 и 2 объекты и результаты такого объединения помещаем в таблицу 5.6.5. Затем к ним присоединяем 3 объект и результаты объединения помещаем в таблицу 5.6.7. Таблица 5.6.6
Таблица 5.6.7
На рис.5.6.3 представлена дендрограмма результатов кластерного анализа. Расстояние 8 8,00 6 4 2 1 2 3 4 5 6 Номера объектов Рис.5.6.3 Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.6.8) и символов Кронекера (таблица 5.6.9). Таблица 5.6.8
Таблица 5.6.9
Подсчитаем сумму расстояний между объектами: 0+ 4+ 4+ 12+ 14+ 17+ 0+ 0+ 4+ 12+ 14+ 17+ 0+ 0+ 0+ 8+ 10+ 13+ 0+ 0+ 0+ 0+ 2+ 5+ 0+ 0+ 0+ 0+ 0+ 3 =139. Среднее расстояние = 139/15=9,27. Сумма расстояний между объектами, вошедшими в кластеры: 1∙4+1∙4+1∙4+1∙2+1∙5+1∙3=22. Среднее расстояние между объектами в кластерах = 22/6=3,67. Сумма расстояний между объектами, находящимися в разных кластерах: (1-0)∙12+(1-0)∙14+(1-0)∙17+ +(1-0)∙12+(1-0)∙14+(1-0)∙17+ +(1-0)∙8+(1-0)∙10+(1-0)∙13= 117. Среднее расстояние между объектами, находящимися в разных кластерах =117/9=13. Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 9,27/3,67=2,52; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 13/9,27=1,4. Рассмотренные шесть примеров наглядно продемонстрировли методику применения основных методов кластерного анализа. Получение одинаковых результатов по всем рассмотренным методам объясняется сравнительной несложностью рассматриваемого примера. При усложнении примера следует ожидать различий в результатах кластерного анализа. Задание 1.6 Пример 6.1 Провести сглаживание и временное прогнозирование количества персональных компьютеров в организациях РФ в тысячах методом скользящего среднего с шагом m=3 числа. Первые пять значений использовать для прогнозирования; три последних значения использовать для оценки качества аппроксимации и спрогнозировать ещё три значения на 2011, 2012 и 2013 годы.
Вычислим сглаженные значения числа ПК: Вычислим цепной годовой прирост: Вычислим спрогнозированные значения числа ПК для оценки качества: Вычислим среднее значение для трёх спрогнозированных лет: Вычислим среднеквадратическую ошибку прогнозирования: Вычислим отношение ошибки к среднему значению: Так как отношение среднеквадратической ошибки к среднему значению превышает рекомендуемое значение 0.05 сравнительно на немного, то резуль-тат признаем допустимым. Полученные результаты сглаживания и прогнозирования.
Спрогнозируем количество ПК в 2011, 2012, 2013 годах. Вычислим спрогнозированные значения числа ПК для оценки качества: Полученные результаты сглаживания и прогнозирования.
На рис.6.1 результаты сглаживания и прогнозирования представлены в графическом виде. |