Главная страница
Навигация по странице:

  • Obj. No. Obj. No. Obj. No. Obj. No.

  • Метод K –средних

  • Cluster Cluster Cluster Длина чашелистика

  • No. 1 No. 2 No. 3 No. 1

  • No. 2 0,886441 0,000000 6,192492 No. 3

  • Between df Within df F

  • Класса № случая CLUSTER DISTANCE

  • лабораторная работа №3 Иерархическая кластеризация. Лабораторная работа 3 Иерархическая кластеризация Теоретическая часть


    Скачать 0.51 Mb.
    НазваниеЛабораторная работа 3 Иерархическая кластеризация Теоретическая часть
    Дата23.02.2023
    Размер0.51 Mb.
    Формат файлаdocx
    Имя файлалабораторная работа №3 Иерархическая кластеризация.docx
    ТипЛабораторная работа
    #952112
    страница2 из 7
    1   2   3   4   5   6   7




      1. Принцип объединения – метод Варда, расстояние – евклидово






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    25.86407

    Ширина чашелистика

    Ширина лепестка







    28.95238

    Длина чашелистика

    Длина лепестка







    49,19687

    Длина чашелистика

    Длина лепестка

    Ширина чашелистика

    Ширина лепестка




      1. Принцип объединения – метод Варда, расстояние – чебышевское






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    4,000000

    Ширина чашелистика

    Ширина лепестка







    4,600000

    Длина чашелистика

    Длина лепестка







    5,700000

    Длина чашелистика

    Длина лепестка

    Ширина чашелистика

    Ширина лепестка

      1. Принцип объединения – метод Варда, расстояние – манхэттенское






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    278,7000

    Ширина чашелистика

    Ширина лепестка







    312,0000

    Длина чашелистика

    Длина лепестка







    605,6500

    Длина чашелистика

    Длина лепестка

    Ширина чашелистика

    Ширина лепестка

      1. Принцип объединения – невзвешенное попарное среднее, расстояние – евклидово






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    25,86407

    Ширина чашелистика

    Ширина лепестка







    28,95238

    Длина чашелистика

    Длина лепестка







    38,30255

    Длина чашелистика

    Длина лепестка

    Ширина чашелистика

    Ширина лепестка




      1. Принцип объединения – невзвешенное попарное среднее, расстояние – чебышевское






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    4,000000

    Ширина чашелистика

    Ширина лепестка







    4,500000

    Ширина чашелистика

    Ширина лепестка

    Длина лепестка




    5,200000

    Длина чашелистика

    Ширина чашелистика

    Ширина лепестка

    Длина лепестка




      1. Принцип объединения – невзвешенное попарное среднее, расстояние – манхэттенское






    Obj. No.

    Obj. No.

    Obj. No.

    Obj. No.

    25,86407

    Ширина чашелистика

    Ширина лепестка







    28,95238

    Длина чашелистика

    Длина лепестка







    49.19687

    Длина чашелистика

    Длина лепестка

    Ширина чашелистика

    Ширина лепестка

    Другие характеристики кластеризации:

    График возрастания расстояния по мере кластеризации



    Здесь график построен для метода одиночно связи и евклидова расстояния. Он показывает, насколько на каждом шаге возрастает расстояние между кластерами и может быть полезен принятии решения о прекращении кластеризации

    Помимо того, можно вывести матрицу расстояний между всеми объектами или признаками и средние и дисперсии для каждого объекта или признака

    Метод K –средних

    Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.

    Построим данные по ирисам : количество кластеров – 3, количество итераций – 10.

    Результаты : средние по кластерам :




    Cluster

    Cluster

    Cluster

    Длина чашелистика

    5,885000

    6,827500

    5,006000

    Ширина чашелистика

    2,741667

    3,067500

    3,428000

    Длина лепестка

    4,380000

    5,720000

    1,462000

    Ширина лепестка

    1,438333

    2,032500

    0,246000

    Евклидовы расстояния между кластерами :




    No. 1

    No. 2

    No. 3

    No. 1

    0,000000

    0,785777

    2,795019

    No. 2

    0,886441

    0,000000

    6,192492

    No. 3

    1,671831

    2,488472

    0,000000

    Графики средних по кластерам:



    Анализ дисперсии :




    Between

    df

    Within

    df

    F

    signif.

    Длина чашелистика

    73,9039

    2

    28,26445

    147

    192,183

    0,000000

    Ширина чашелистика

    12,8526

    2

    15,45438

    147

    61,126

    0,000000

    Длина лепестка

    440,7649

    2

    26,43781

    147

    1225,375

    0,000000

    Ширина лепестка

    76,6362

    2

    9,93379

    147

    567,030

    0,000000


    Описательные статистики :

    Для кластера 1 :




    Mean

    Standard

    Variance

    Длина чашелистика

    5,885000

    0,451673

    0,204009

    Ширина чашелистика

    2,741667

    0,295326

    0,087218

    Длина лепестка

    4,380000

    0,504824

    0,254848

    Ширина лепестка

    1,438333

    0,300898

    0,090540

    Для кластера 2 :




    Mean

    Standard

    Variance

    Длина чашелистика

    6,827500

    0,509896

    0,259994

    Ширина чашелистика

    3,067500

    0,289462

    0,083788

    Длина лепестка

    5,720000

    0,504442

    0,254462

    Ширина лепестка

    2,032500

    0,322162

    0,103789

    Для кластера 3 :




    Mean

    Standard

    Variance

    Длина чашелистика

    5,006000

    0,352490

    0,124249

    Ширина чашелистика

    3,428000

    0,379064

    0,143690

    Длина лепестка

    1,462000

    0,173664

    0,030159

    Ширина лепестка

    0,246000

    0,105386

    0,011106

    Итог кластеризации для каждого случая:




    Класса

    случая

    CLUSTER

    DISTANCE




    1,000

    1

    3

    0,07




    1,000

    2

    3

    0,22




    1,000

    3

    3

    0,21




    1,000

    4

    3

    0,26




    1,000

    5

    3

    0,09




    1,000

    6

    3

    0,34




    1,000

    7

    3

    0,21




    1,000

    8

    3

    0,03




    1,000

    9

    3

    0,40




    1,000

    10

    3

    0,19




    1,000

    11

    3

    0,24




    1,000

    12

    3

    0,13




    1,000

    13

    3

    0,25




    1,000

    14

    3

    0,46




    1,000

    15

    3

    0,51




    1,000

    16

    3

    0,60




    1,000

    17

    3

    0,33




    1,000

    18

    3

    0,07




    1,000

    19

    3

    0,41




    1,000

    20

    3

    0,19




    1,000

    21

    3

    0,23




    1,000

    22

    3

    0,16




    1,000

    23

    3

    0,32




    1,000

    24

    3

    0,19




    1,000

    25

    3

    0,24




    1,000

    26

    3

    0,23




    1,000

    27

    3

    0,10




    1,000

    28

    3

    0,11




    1,000

    29

    3

    0,11




    1,000

    30

    3

    0,20




    1,000

    31

    3

    0,21




    1,000

    32

    3

    0,21




    1,000

    33

    3

    0,36




    1,000

    34

    3

    0,46




    1,000

    35

    3

    0,17




    1,000

    36

    3

    0,18




    1,000

    37

    3

    0,26




    1,000

    38

    3

    0,13




    1,000

    39

    3

    0,38




    1,000

    40

    3

    0,06




    1,000

    41

    3

    0,09




    1,000

    42

    3

    0,62




    1,000

    43

    3

    0,33




    1,000

    44

    3

    0,19




    1,000

    45

    3

    0,30




    1,000

    46

    3

    0,24




    1,000

    47

    3

    0,21




    1,000

    48

    3

    0,24




    1,000

    49

    3

    0,20




    1,000

    50

    3

    0,07




    2,000

    51

    2

    0,61




    2,000

    52

    1

    0,35




    2,000

    53

    2

    0,49




    2,000

    54

    1

    0,36




    2,000

    55

    1

    0,33




    2,000

    56

    1

    0,13




    2,000

    57

    1

    0,39




    2,000

    58

    1

    0,78




    2,000

    59

    1

    0,39




    2,000

    60

    1

    0,42




    2,000

    61

    1

    0,76




    2,000

    62

    1

    0,16




    2,000

    63

    1

    0,40




    2,000

    64

    1

    0,21




    2,000

    65

    1

    0,43




    2,000

    66

    1

    0,45




    2,000

    67

    1

    0,20




    2,000

    68

    1

    0,26




    2,000

    69

    1

    0,32




    2,000

    70

    1

    0,35




    2,000

    71

    1

    0,36




    2,000

    72

    1

    0,23




    2,000

    73

    1

    0,36




    2,000

    74

    1

    0,23




    2,000

    75

    1

    0,28




    2,000

    76

    1

    0,38




    2,000

    77

    1

    0,50




    2,000

    78

    2

    0,40




    2,000

    79

    1

    0,12




    2,000

    80

    1

    0,51




    2,000

    81

    1

    0,42




    2,000

    82

    1

    0,48




    2,000

    83

    2

    0,69




    2,000

    84

    1

    0,17




    2,000

    85

    1

    0,28




    2,000

    86

    1

    0,35




    2,000

    87

    1

    0,47




    2,000

    88

    1

    0,31




    2,000

    89

    1

    0,25




    2,000

    90

    1

    0,30




    2,000

    91

    1

    0,24




    2,000

    92

    1

    0,20




    2,000

    93

    1

    0,24




    2,000

    94

    1

    0,76




    2,000

    95

    1

    0,18




    2,000

    96

    1

    0,22




    2,000

    97

    1

    0,17




    2,000

    98

    1

    0,19




    2,000

    99

    1

    0,82




    2,000

    100

    1

    0,18




    3,000

    101

    2

    0,40




    3,000

    102

    1

    0,43




    3,000

    103

    2

    0,17




    3,000

    104

    2

    0,31




    3,000

    105

    2

    0,19




    3,000

    106

    2

    0,59




    3,000

    107

    1

    0,53




    3,000

    108

    2

    0,40




    3,000

    109

    2

    0,32




    3,000

    110

    2

    0,44




    3,000

    111

    2

    0,36




    3,000

    112

    2

    0,36




    3,000

    113

    2

    0,12




    3,000

    114

    1

    0,45




    3,000

    115

    1

    0,60




    3,000

    116

    2

    0,33




    3,000

    117

    2

    0,23




    3,000

    118

    2

    0,76




    3,000

    119

    2

    0,78




    3,000

    120

    1

    0,42




    3,000

    121

    2

    0,15




    3,000

    122

    1

    0,41




    3,000

    123

    2

    0,67




    3,000

    124

    1

    0,38




    3,000

    125

    2

    0,14




    3,000

    126

    2

    0,27




    3,000

    127

    1

    0,32




    3,000

    128

    1

    0,36




    3,000

    129

    2

    0,26




    3,000

    130

    2

    0,29




    3,000

    131

    2

    0,37




    3,000

    132

    2

    0,73




    3,000

    133

    2

    0,27




    3,000

    134

    1

    0,42




    3,000

    135

    2

    0,54




    3,000

    136

    2

    0,50




    3,000

    137

    2

    0,37




    3,000

    138

    2

    0,27




    3,000

    139

    1

    0,31




    3,000

    140

    2

    0,17




    3,000

    141

    2

    0,20




    3,000

    142

    2

    0,34




    3,000

    143

    1

    0,43




    3,000

    144

    2

    0,17




    3,000

    145

    2

    0,27




    3,000

    146

    2

    0,30




    3,000

    147

    1

    0,46




    3,000

    148

    2

    0,31




    3,000

    149

    2

    0,41




    3,000

    150

    1

    0,42
    1   2   3   4   5   6   7


    написать администратору сайта