Практическая по RapidMiner. Использованные фильтры kMeans
Скачать 0.67 Mb.
|
Предполагается 5 кластеров. Использованные фильтрыk-Means
TP: 5 FP: 15 FN: 15 Precision = 5 / (5 + 15) = 0.25 Recall = 5 / (5 + 15) = 0.25 F = 2* ((0.25 * 0.25) / (0.25+0.25)) = 2*(0.0625/0.5) = 0.25 Random Clustering
TP: 3 FP: 17 FN: 17 Precision = 3 / (3 + 17) = 0.15 Recall = 3 / (3 + 17) = 0.15 F = 2* ((0.15 * 0.15) / (0.15+0.15)) = 2*(0.0225/0.3) = 0.15 Вывод:Были использованы следующие алгоритмы: k-Means и random clustering. Оба алгоритма вынуждают указывать количество кластеров, т.е их нужно знать заранее. k-Means для каждого кластера на каждой итерации вычисляет центр масс заново, затем идёт разбиение на новые кластеры в соответствии с тем, какой центром оказался ближе к выбранной метрике. Когда не происходит изменения кластеров, то алгоритм завершает свою работу. Random clustering перебирает все тексты и случайно присваивает им кластер. В связи с этим алгоритм k-Means работает лучше. |