Вход
Регистрация

Войти c помощью аккаунта

Статьи

Деревья решений — C4.5 математический аппарат. Часть 1

Описание метода построения деревьев решений, который впервые был предложен Р. Куинленом (R. Quinlan). Этот метод используется в одном из лучших алгоритмов построения деревьев решений C4.5.

Логистическая регрессия и ROC-анализ — математический аппарат

В статье рассказывается о математическом аппарате и назначении бинарной логистической регрессии – популярного инструмента для решения задач регрессии и классификации. ROC-анализ тесно связан с бинарной логистической регрессией и применяется для оценки качества моделей: позволяет выбрать аналитику модель с наилучшей прогностической силой, проанализировать чувствительность и специфичность моделей, подобрать порог отсечения.

Алгоритмы кластеризации на службе Data Mining

Данный материал - попытка систематизировать и дать целостный взгляд на последние достижения в области разработки эффективных подходов к кластеризации данных. Целью материала не являлось подробное описание всех алгоритмов кластеризации. Наоборот, обзорный характер статьи и затронутая проблематика помогут сориентироваться в огромном количестве алгоритмов кластеризации.

Непрерывные генетические алгоритмы — математический аппарат

В статье рассказывается о генетических алгоритмах (ГА), в которых хромосома представляется вектором вещественных чисел. Такой вид ГА получил название непрерывного генетического алгоритма (Real-Coded GA). В отличие от классического ГА, в real-coded алгоритме нет необходимости в операциях кодирования/декодирования, поэтому он более предпочтителен для решения задач оптимизации в непрерывных пространствах. Из статьи вы узнаете о преимуществах непрерывных ГА и познакомитесь с наиболее популярными их реализациями.

Кластеризация категорийных данных: масштабируемый алгоритм CLOPE

Разбиение на группы со схожими характеристиками категорийных и транзакционных массивов данных в больших БД является важнейшей задачей Data Mining. Традиционные алгоритмы кластеризации в большинстве случаев не эффективны при обработке сверхбольших баз данных. В материале рассказывается о масштабируемом эвристическом алгоритме CLOPE, который позволяет проводить кластеризацию с высоким качеством и производительностью.

Приложения вейвлет-анализа

В статье рассматриваются самые актуальные вопросы применения вейвлетов в наиболее общих задачах, связанных с обработкой информации, таких как очистка сигнала от помех, сжатие данных, выявление кратковременных и глобальных закономерностей, спектральный анализ составляющих сигнала.

Деревья решений — общие принципы работы

Деревья решений – один из методов автоматического анализа данных. Они позволяют представлять правила в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Под правилом понимается логическая конструкция, представленная в виде "если... то...". Описаны общие принципы работы и области применения деревьев решений.

Деревья решений — CART математический аппарат. Часть 1

Описание одного из наиболее популярных алгоритмов построения деревьев решений - CART (Classification And Regression Tree). Алгоритм, предложенный Бриманом и др. в 1984 году, предназначен для решения задач классификации и регрессии. Результатом его работы является бинарное дерево решений.

Нечеткая логика — математические основы

В статье приводится краткое описание истории возникновения нечеткой логики, излагаются математические основы теории нечетких множеств и рассматривается схема нечеткого вывода по Мамдани. В конце рассказано о влиянии нечеткой логики на развитие методов и алгоритмов анализа данных.

Нечеткие запросы к реляционным базам данных

В статье рассказывается о нечетких запросах - применении аппарата нечеткой логики для извлечения данных из реляционных таблиц. На примерах демонстрируются принципы извлечения числовой информации на основе нечетко сформулированных высказываний: "большая скидка", "высокая цена", "молодой сотрудник" и т.п.

Страницы