Принцип объединения – метод Варда, расстояние – евклидово
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 25.86407
| Ширина чашелистика
| Ширина лепестка
|
|
| 28.95238
| Длина чашелистика
| Длина лепестка
|
|
| 49,19687
| Длина чашелистика
| Длина лепестка
| Ширина чашелистика
| Ширина лепестка
|
Принцип объединения – метод Варда, расстояние – чебышевское
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 4,000000
| Ширина чашелистика
| Ширина лепестка
|
|
| 4,600000
| Длина чашелистика
| Длина лепестка
|
|
| 5,700000
| Длина чашелистика
| Длина лепестка
| Ширина чашелистика
| Ширина лепестка
| Принцип объединения – метод Варда, расстояние – манхэттенское
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 278,7000
| Ширина чашелистика
| Ширина лепестка
|
|
| 312,0000
| Длина чашелистика
| Длина лепестка
|
|
| 605,6500
| Длина чашелистика
| Длина лепестка
| Ширина чашелистика
| Ширина лепестка
| Принцип объединения – невзвешенное попарное среднее, расстояние – евклидово
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 25,86407
| Ширина чашелистика
| Ширина лепестка
|
|
| 28,95238
| Длина чашелистика
| Длина лепестка
|
|
| 38,30255
| Длина чашелистика
| Длина лепестка
| Ширина чашелистика
| Ширина лепестка
|
Принцип объединения – невзвешенное попарное среднее, расстояние – чебышевское
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 4,000000
| Ширина чашелистика
| Ширина лепестка
|
|
| 4,500000
| Ширина чашелистика
| Ширина лепестка
| Длина лепестка
|
| 5,200000
| Длина чашелистика
| Ширина чашелистика
| Ширина лепестка
| Длина лепестка
|
Принцип объединения – невзвешенное попарное среднее, расстояние – манхэттенское
| Obj. No.
| Obj. No.
| Obj. No.
| Obj. No.
| 25,86407
| Ширина чашелистика
| Ширина лепестка
|
|
| 28,95238
| Длина чашелистика
| Длина лепестка
|
|
| 49.19687
| Длина чашелистика
| Длина лепестка
| Ширина чашелистика
| Ширина лепестка
| Другие характеристики кластеризации:
График возрастания расстояния по мере кластеризации
Здесь график построен для метода одиночно связи и евклидова расстояния. Он показывает, насколько на каждом шаге возрастает расстояние между кластерами и может быть полезен принятии решения о прекращении кластеризации
Помимо того, можно вывести матрицу расстояний между всеми объектами или признаками и средние и дисперсии для каждого объекта или признака
Метод K –средних
Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Построим данные по ирисам : количество кластеров – 3, количество итераций – 10.
Результаты : средние по кластерам :
| Cluster
| Cluster
| Cluster
| Длина чашелистика
| 5,885000
| 6,827500
| 5,006000
| Ширина чашелистика
| 2,741667
| 3,067500
| 3,428000
| Длина лепестка
| 4,380000
| 5,720000
| 1,462000
| Ширина лепестка
| 1,438333
| 2,032500
| 0,246000
| Евклидовы расстояния между кластерами :
| No. 1
| No. 2
| No. 3
| No. 1
| 0,000000
| 0,785777
| 2,795019
| No. 2
| 0,886441
| 0,000000
| 6,192492
| No. 3
| 1,671831
| 2,488472
| 0,000000
| Графики средних по кластерам:
Анализ дисперсии :
| Between
| df
| Within
| df
| F
| signif.
| Длина чашелистика
| 73,9039
| 2
| 28,26445
| 147
| 192,183
| 0,000000
| Ширина чашелистика
| 12,8526
| 2
| 15,45438
| 147
| 61,126
| 0,000000
| Длина лепестка
| 440,7649
| 2
| 26,43781
| 147
| 1225,375
| 0,000000
| Ширина лепестка
| 76,6362
| 2
| 9,93379
| 147
| 567,030
| 0,000000
|
Описательные статистики :
Для кластера 1 :
| Mean
| Standard
| Variance
| Длина чашелистика
| 5,885000
| 0,451673
| 0,204009
| Ширина чашелистика
| 2,741667
| 0,295326
| 0,087218
| Длина лепестка
| 4,380000
| 0,504824
| 0,254848
| Ширина лепестка
| 1,438333
| 0,300898
| 0,090540
| Для кластера 2 :
| Mean
| Standard
| Variance
| Длина чашелистика
| 6,827500
| 0,509896
| 0,259994
| Ширина чашелистика
| 3,067500
| 0,289462
| 0,083788
| Длина лепестка
| 5,720000
| 0,504442
| 0,254462
| Ширина лепестка
| 2,032500
| 0,322162
| 0,103789
| Для кластера 3 :
| Mean
| Standard
| Variance
| Длина чашелистика
| 5,006000
| 0,352490
| 0,124249
| Ширина чашелистика
| 3,428000
| 0,379064
| 0,143690
| Длина лепестка
| 1,462000
| 0,173664
| 0,030159
| Ширина лепестка
| 0,246000
| 0,105386
| 0,011106
| Итог кластеризации для каждого случая:
| № Класса
| № случая
| CLUSTER
| DISTANCE
|
| 1,000
| 1
| 3
| 0,07
|
| 1,000
| 2
| 3
| 0,22
|
| 1,000
| 3
| 3
| 0,21
|
| 1,000
| 4
| 3
| 0,26
|
| 1,000
| 5
| 3
| 0,09
|
| 1,000
| 6
| 3
| 0,34
|
| 1,000
| 7
| 3
| 0,21
|
| 1,000
| 8
| 3
| 0,03
|
| 1,000
| 9
| 3
| 0,40
|
| 1,000
| 10
| 3
| 0,19
|
| 1,000
| 11
| 3
| 0,24
|
| 1,000
| 12
| 3
| 0,13
|
| 1,000
| 13
| 3
| 0,25
|
| 1,000
| 14
| 3
| 0,46
|
| 1,000
| 15
| 3
| 0,51
|
| 1,000
| 16
| 3
| 0,60
|
| 1,000
| 17
| 3
| 0,33
|
| 1,000
| 18
| 3
| 0,07
|
| 1,000
| 19
| 3
| 0,41
|
| 1,000
| 20
| 3
| 0,19
|
| 1,000
| 21
| 3
| 0,23
|
| 1,000
| 22
| 3
| 0,16
|
| 1,000
| 23
| 3
| 0,32
|
| 1,000
| 24
| 3
| 0,19
|
| 1,000
| 25
| 3
| 0,24
|
| 1,000
| 26
| 3
| 0,23
|
| 1,000
| 27
| 3
| 0,10
|
| 1,000
| 28
| 3
| 0,11
|
| 1,000
| 29
| 3
| 0,11
|
| 1,000
| 30
| 3
| 0,20
|
| 1,000
| 31
| 3
| 0,21
|
| 1,000
| 32
| 3
| 0,21
|
| 1,000
| 33
| 3
| 0,36
|
| 1,000
| 34
| 3
| 0,46
|
| 1,000
| 35
| 3
| 0,17
|
| 1,000
| 36
| 3
| 0,18
|
| 1,000
| 37
| 3
| 0,26
|
| 1,000
| 38
| 3
| 0,13
|
| 1,000
| 39
| 3
| 0,38
|
| 1,000
| 40
| 3
| 0,06
|
| 1,000
| 41
| 3
| 0,09
|
| 1,000
| 42
| 3
| 0,62
|
| 1,000
| 43
| 3
| 0,33
|
| 1,000
| 44
| 3
| 0,19
|
| 1,000
| 45
| 3
| 0,30
|
| 1,000
| 46
| 3
| 0,24
|
| 1,000
| 47
| 3
| 0,21
|
| 1,000
| 48
| 3
| 0,24
|
| 1,000
| 49
| 3
| 0,20
|
| 1,000
| 50
| 3
| 0,07
|
| 2,000
| 51
| 2
| 0,61
|
| 2,000
| 52
| 1
| 0,35
|
| 2,000
| 53
| 2
| 0,49
|
| 2,000
| 54
| 1
| 0,36
|
| 2,000
| 55
| 1
| 0,33
|
| 2,000
| 56
| 1
| 0,13
|
| 2,000
| 57
| 1
| 0,39
|
| 2,000
| 58
| 1
| 0,78
|
| 2,000
| 59
| 1
| 0,39
|
| 2,000
| 60
| 1
| 0,42
|
| 2,000
| 61
| 1
| 0,76
|
| 2,000
| 62
| 1
| 0,16
|
| 2,000
| 63
| 1
| 0,40
|
| 2,000
| 64
| 1
| 0,21
|
| 2,000
| 65
| 1
| 0,43
|
| 2,000
| 66
| 1
| 0,45
|
| 2,000
| 67
| 1
| 0,20
|
| 2,000
| 68
| 1
| 0,26
|
| 2,000
| 69
| 1
| 0,32
|
| 2,000
| 70
| 1
| 0,35
|
| 2,000
| 71
| 1
| 0,36
|
| 2,000
| 72
| 1
| 0,23
|
| 2,000
| 73
| 1
| 0,36
|
| 2,000
| 74
| 1
| 0,23
|
| 2,000
| 75
| 1
| 0,28
|
| 2,000
| 76
| 1
| 0,38
|
| 2,000
| 77
| 1
| 0,50
|
| 2,000
| 78
| 2
| 0,40
|
| 2,000
| 79
| 1
| 0,12
|
| 2,000
| 80
| 1
| 0,51
|
| 2,000
| 81
| 1
| 0,42
|
| 2,000
| 82
| 1
| 0,48
|
| 2,000
| 83
| 2
| 0,69
|
| 2,000
| 84
| 1
| 0,17
|
| 2,000
| 85
| 1
| 0,28
|
| 2,000
| 86
| 1
| 0,35
|
| 2,000
| 87
| 1
| 0,47
|
| 2,000
| 88
| 1
| 0,31
|
| 2,000
| 89
| 1
| 0,25
|
| 2,000
| 90
| 1
| 0,30
|
| 2,000
| 91
| 1
| 0,24
|
| 2,000
| 92
| 1
| 0,20
|
| 2,000
| 93
| 1
| 0,24
|
| 2,000
| 94
| 1
| 0,76
|
| 2,000
| 95
| 1
| 0,18
|
| 2,000
| 96
| 1
| 0,22
|
| 2,000
| 97
| 1
| 0,17
|
| 2,000
| 98
| 1
| 0,19
|
| 2,000
| 99
| 1
| 0,82
|
| 2,000
| 100
| 1
| 0,18
|
| 3,000
| 101
| 2
| 0,40
|
| 3,000
| 102
| 1
| 0,43
|
| 3,000
| 103
| 2
| 0,17
|
| 3,000
| 104
| 2
| 0,31
|
| 3,000
| 105
| 2
| 0,19
|
| 3,000
| 106
| 2
| 0,59
|
| 3,000
| 107
| 1
| 0,53
|
| 3,000
| 108
| 2
| 0,40
|
| 3,000
| 109
| 2
| 0,32
|
| 3,000
| 110
| 2
| 0,44
|
| 3,000
| 111
| 2
| 0,36
|
| 3,000
| 112
| 2
| 0,36
|
| 3,000
| 113
| 2
| 0,12
|
| 3,000
| 114
| 1
| 0,45
|
| 3,000
| 115
| 1
| 0,60
|
| 3,000
| 116
| 2
| 0,33
|
| 3,000
| 117
| 2
| 0,23
|
| 3,000
| 118
| 2
| 0,76
|
| 3,000
| 119
| 2
| 0,78
|
| 3,000
| 120
| 1
| 0,42
|
| 3,000
| 121
| 2
| 0,15
|
| 3,000
| 122
| 1
| 0,41
|
| 3,000
| 123
| 2
| 0,67
|
| 3,000
| 124
| 1
| 0,38
|
| 3,000
| 125
| 2
| 0,14
|
| 3,000
| 126
| 2
| 0,27
|
| 3,000
| 127
| 1
| 0,32
|
| 3,000
| 128
| 1
| 0,36
|
| 3,000
| 129
| 2
| 0,26
|
| 3,000
| 130
| 2
| 0,29
|
| 3,000
| 131
| 2
| 0,37
|
| 3,000
| 132
| 2
| 0,73
|
| 3,000
| 133
| 2
| 0,27
|
| 3,000
| 134
| 1
| 0,42
|
| 3,000
| 135
| 2
| 0,54
|
| 3,000
| 136
| 2
| 0,50
|
| 3,000
| 137
| 2
| 0,37
|
| 3,000
| 138
| 2
| 0,27
|
| 3,000
| 139
| 1
| 0,31
|
| 3,000
| 140
| 2
| 0,17
|
| 3,000
| 141
| 2
| 0,20
|
| 3,000
| 142
| 2
| 0,34
|
| 3,000
| 143
| 1
| 0,43
|
| 3,000
| 144
| 2
| 0,17
|
| 3,000
| 145
| 2
| 0,27
|
| 3,000
| 146
| 2
| 0,30
|
| 3,000
| 147
| 1
| 0,46
|
| 3,000
| 148
| 2
| 0,31
|
| 3,000
| 149
| 2
| 0,41
|
| 3,000
| 150
| 1
| 0,42
| |