Самоорганизующиеся карты Кохонена – это одна из разновидностей нейросетевых алгоритмов. Этот алгоритм решает задачи кластеризации и проецирования многомерного пространства в пространство с более низкой размерностью. Он часто применяются для решения самых различных задач, от восстановления пропусков в данных до анализа и поиска закономерностей.
При создании хранилищ данных очень мало внимания уделяется очистке поступающей в него информации. Видимо считается, что чем больше размер хранилища данных, тем лучше. Это порочная практика и лучший способ превратить хранилище данных в свалку. Механизмы фильтрации должны стать такими же неотъемлемым атрибутами хранилищ данных как OLAP. Иначе в горе собранного мусора будет практически невозможно найти зерно полезного.
Кроме алгоритма a priori, для поиска ассоциативных правил является алгоритм, получивший название Frequent Pattern-Growth (FPG), что можно перевести как «выращивание популярных (часто встречающихся) предметных наборов». Он позволяет не только избежать затратной процедуры генерации кандидатов, но уменьшить необходимое число проходов по набору данных до двух.
Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно. Для того чтобы провести автоматический анализ данных, используется Data Mining.
Компьютер используется для поиска информации адрес, а человек ассоциации. Принципиальную ограниченность современных компьютеров можно обойти при помощи различного рода систем ассоциативной памяти, например, сетей Хемминга. Описание алгоритма и пример работы.
Вторая часть описания математического аппарата алгоритма CART. Описаны вопросы построения оптимального дерева, обработки пропущенных значений, отсечения ветвей, решения задачи регрессии.
Как правило, руководители компаний уделяют большое внимание усовершенствованию систем финансового менеджмента, необоснованно забывая об одном из главных ресурсов любой организации - сотрудниках. Вложения, сделанные в развитие сотрудников, предполагают дальнейшее приумножение потраченных средств, но работа компании не будет продуктивной при высокой текучке кадров. С каждым уходом высококвалифицированных сотрудников теряется их опыт, а пока новичок будет приобретать достаточные профессиональные навыки, будут снижаться темп и качество работы. Своевременная диагностика динамики изменения структуры персонала, его численности и движения позволит создать более эффективную и целостную кадровую стратегию, направленную на удержание ценных специалистов.
Важнейший фактор успешной работы любой компании - умение привлечь новых клиентов. Одним из основных инструментов решения этой задачи является проведение рекламных кампаний. В данной статье описывается методика оценки эффективности рекламных акций и проводимой ценовой политики для одного продукта массового потребления.
При помощи логистической регрессии можно тестировать линейную зависимость между зависимой и независимой переменными. Преимущество логистической регрессии заключается в том, что данная модель является наглядной, а использование ROC-анализа позволяет сравнивать модели и подбирать оптимальный порог отсечения. Материал показывает, как это делается в медицине и скоринге.
Применение самоорганизующихся карт для сегментации данных. Механизмы анализа при отсутствии четких правил. Сравнительный анализ объектов, демонстрируется на примерах информации по банкам, клиентам городской теплосети и пациентам кардиодиспансера.