Википедия
k-means (метод k-средних) — наиболее популярный метод кластеризации . Был изобретён в 1950-х годах математиком Гуго Штейнгаузом и почти одновременно Стюартом Ллойдом. Особую популярность приобрёл после работы Маккуина.
Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:
V = ∑∑(x − μ)где k — число кластеров, S — полученные кластеры, i = 1, 2, …, k и μ — центры масс векторов x ∈ S.
По аналогии с методом главных компонент центры кластеров называются также главными точками, а сам метод называется методом главных точек и включается в общую теорию главных объектов, обеспечивающих наилучшую аппроксимацию данных.