Задач. Задачи по статистике решённые. Пример задания 1
Скачать 1.07 Mb.
|
Таким образом процесс кластерного анализа закончен. Выделено два кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2. Расстояние 10,52 10 8 6 4 2 1 2 3 4 5 6 Номера объектов Рис. 5.3.2 Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8). Таблица 5.3.7
Таблица 5.3.8
Подсчитаем сумму расстояний между объектами: 0+2,83+3,16+10,19+12,17+13,60+ 0+ 0+ 3,16+ 8,94+10,77+12,53+ 0+ 0+ 0+ 7,07+ 9,06+10,44+ 0+ 0+ 0+ 0+ 2+ 3,61+ 0+ 0+ 0+ 0+ 0+ 2,24 =111,77. Среднее расстояние = 111,77/15=7,45. Сумма расстояний между объектами, вошедшими в кластеры: 1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00. Среднее расстояние между объектами в кластерах = 17,00/6=2,83. Сумма расстояний между объектами, находящимися в разных кластерах: (1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+ +(1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+ +(1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77. Среднее расстояние между объектами, находящимися в разных кластерах =94,77/9=10,53. Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41. Пример 5.4 Евклидово расстояние. По медиане Требуется разделить шесть объектов на два кластера. Объекты – информационные системы характеризуются двумя признаками: Х1-среднее время решения одной задачи в минутах; Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы. Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.4.1. Таблица 5.4.1
Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.4.2. Таблица 5.4.2
Жирным шрифтом в таблице 5.4.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «медианы» и представлены в таблице 5.4.3. Применение принципа по вычислению расстояния между первым объектом и формирующимся объектом, состоящим из 4 и 5 объектов поясняется рис.5.4.1. 4 b=3,61 6 m=2,83 a=2,00 c=2,24 5 Рис.5.4.1 Таблица 5.4.3
Жирным шрифтом в таблице 5.4.3 выделено наименьшее расстояние между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « медианы» и представлены в таблице 5.4.4. Таблица 5.4.4
Жирным шрифтом в таблице 5.4.4 выделено наименьшее расстояние между объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2.3. Расстояния между этим укрупнённым и другими объектами определены по принципу «медианы» и представлены в таблице 5.4.5. Таблица 5.4.5
Жирным шрифтом в таблице 5.4.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между укрупнёнными объектами определены по принципу «медианы» и представлены в таблице 5.4.6. Таблица 5.4.6
|