доклад. докладес. Метод k средних (kmeans) Что это такое
Скачать 1.95 Mb.
|
Метод k средних (k-means) Что это такое Метод k-средних – это метод кластерного анализа, цель которого является разделение m наблюдений (из пространства Rn) на k кластеров, при этом каждое наблюдение относится к тому кластеру, к центру (центроиду) которого оно ближе всего. В качестве меры близости используется Евклидово расстояние: где x, y ∈ Rn. Как это работает Рассмотрим ряд наблюдений Метод k-средних разделяет m наблюдений на k групп (или кластеров) (k ≤ m) S={S1, S2, …,Sk}, чтобы минимизировать суммарное квадратичное отклонение точек кластеров от центроидов этих кластеров: где μi – центроид кластера Si Как это работает Как это работает Как это работает Как это работает Центроид перевычисляется по следующему правилу: Как это работает Как это работает Алгоритм останавливается, когда центроиды не меняются: Пример Пример Пример |