Самоорганизующиеся карты Кохонена - мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт.
Данный обработчик используется для поиска закономерностей в больших массивах данных. Это позволяет проводить разведочный анализ данных, отличающийся от классических статистических процедур, в ходе которых проверяется некоторый набор выдвинутых гипотез.
Основные преимущества алгоритма:
Разведочный анализ данных. Карта Кохонена способна распознавать кластеры в данных, а также устанавливать близость классов. Таким образом, пользователь может улучшить свое понимание структуры данных, чтобы затем уточнить модель. Если в данных распознаны классы, то их можно обозначить, после чего сеть сможет решать задачи классификации.
Прогнозирование поведения клиента. Если построить карту Кохонена, содержащую кластеры для каждой группы клиентов по степени их лояльности, то с ее помощью можно предсказывать ожидаемое поведение клиентом и применять к ним соответствующую маркетинговую политику.
Обнаружение аномалий. Карта Кохонена распознает кластеры в обучающих данных и относит все данные к тем или иным кластерам. Если после этого карта встретится с набором данных, непохожим ни на один из известных образцов, то она не сможет классифицировать такой набор и тем самым выявит его аномальность.
Алгоритм функционирования самоорганизующихся карт представляет собой один из вариантов кластеризации многомерных векторов – алгоритм проецирования с сохранением топологического подобия. Т.е. если были значительно удалены друг от друга в исходном пространстве, то и на карте они будут значительно удалены друг от друга.
Преимуществом самоорганизующихся карт Кохонена является то, что при обучении используется метод обучения без учителя, то есть результат обучения зависит только от структуры входных данных.
Подробнее карты Кохонена рассмотрены в статьях «Использование самоорганизующихся карт в задачах кластеризации» и «Самоорганизующиеся карты Кохонена - математический аппарат».