Что такое иерархическая кластеризация и когда она используется?



В обычной кластеризации все кластеры равноправны и находятся на одном уровне. В иерархической кластеры бывают вложены друг в друга и образуют древовидную структуру.



Алгоритм, если коротко, такой:

▫️Создаём столько кластеров, сколько у нас объектов в выборке, каждый объект — в своём отдельном кластере.

▫️Повторяем итеративно слияние двух ближайших кластеров, пока не выполнится критерий останова.



В качестве последнего критерия можно использовать либо получение нужного количества кластеров, либо удовлетворений условий, основанных на метриках расстояния между кластерами.



Получившуюся иерархическую структуру анализируют с помощью дендрограммы. Такую кластеризацию можно использовать, когда:

▪️неизвестно количество кластеров.

▪️требуется визуализация структуры данных,

▪️данные обладают естественной иерархической структурой.



#машинное_обучение