Вход
Регистрация

Войти c помощью аккаунта

Дерево решений

Деревья решений – популярный алгоритм классификации, в котором решающие правила извлекаются непосредственно из исходных данных в процессе обучения. Они представляют собой иерархическую последовательность правил вида "Если…то…".

Деревья решений способны выявить нелинейные зависимости и нетипичные (редкие) случаи. Данный алгоритм обработки подробно рассмотрен в статье «Деревья решений - общие принципы работы».

Примеры применения

Оценка кредитоспособности клиента при выдаче кредитов. На базе алгоритма строятся скоринговые карты, модели аппликационного и поведенческого скоринга. Это позволяет проводить выбранную кредитную политику и снижать уровень просроченной задолженности.

Контроль за качеством продукции в промышленности. Алгоритм позволяет автоматически выявлять отклонение от заданных параметров, выявлять дефекты, проводить испытания без разрушения (например, проверка качества сварки).

Диагностика различных заболеваний. Обеспечение поддержки принимаемых врачом решений для повышения эффективности постановки диагноза.

Управление проектами. Алгоритм позволяет рассматривать альтернативные последствия принятия решения и последствия их выбора с учетом проектных рисков. Анализ ожидаемого денежного значения с целью определения относительной стоимости альтернативных действий.

Описание алгоритма

Для принятия решения, к какому классу следует отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня. Вопросы имеют вид, например "значение параметра А больше В?". Если ответ положительный, осуществляется переход к правому узлу следующего уровня. Затем снова идет вопрос, связанный с соответствующим узлом и т. д.

Для интерпретации результатов классификации с помощью дерева решений используются визуализаторы, показывающие структуру дерева, а также сформулированные в нем правила.

В Deductor Studio подобный класс задач реализуется посредством наиболее популярного алгоритма C4.5., в котором количество потомков у узла не ограничено. Не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации.

Математический аппарат и реализация алгоритма рассмотрены в статьях «Деревья решений - C4.5 математический аппарат. Часть 1» и «Деревья решений - C4.5 математический аппарат. Часть 2».