Ближайшего соседа
Скачать 49.89 Kb.
|
Принцип “ближайшего соседа”. Исходные данные.
1. Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами примем обычное евклидовое расстояние. Тогда согласно формуле: где l - признаки; k - количество признаков 2. Полученные данные помещаем в таблицу (матрицу расстояний).
3. Поиск наименьшего расстояния. Из матрицы расстояний следует, что объекты 3 и 6 наиболее близки P3;6 = 1.71 и поэтому объединяются в один кластер.
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №3 и №6. В результате имеем 5 кластера: S(1), S(2), S(3,6), S(4), S(5) Из матрицы расстояний следует, что объекты 3,6 и 5 наиболее близки P3,6;5 = 2.28 и поэтому объединяются в один кластер.
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №3,6 и №5. В результате имеем 4 кластера: S(1), S(2), S(3,6,5), S(4) Из матрицы расстояний следует, что объекты 2 и 4 наиболее близки P2;4 = 4.26 и поэтому объединяются в один кластер.
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №2 и №4. В результате имеем 3 кластера: S(1), S(2,4), S(3,6,5) Из матрицы расстояний следует, что объекты 1 и 2,4 наиболее близки P1;2,4 = 5.21 и поэтому объединяются в один кластер.
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №1 и №2,4. В результате имеем 2 кластера: S(1,2,4), S(3,6,5)
Таким образом, при проведении кластерного анализа по принципу “ближнего соседа” получили два кластера, расстояние между которыми равно P=7.81 Результаты иерархической классификации объектов представлены на рис. в виде дендрограммы. Решение было получено и оформлено с помощью сервиса: Кластерный анализ С этой задачей также решают: Метод К-средних Математические методы в психологии |