Вход
Регистрация

Какой алгоритм классификации(или кластеризации) подойдет?

Есть входной набор данных типа Y(A,B,C,N). Переменная Y может принимать значения 0 и 1. Переменные A,B,C - перечислимые типы, а N - кол-во данных (A,B,C). Обучающая выборка вся стостоит из элементов вида (Y=1, A, B, C, N). Элементы обучающей выборки _НЕ_ принадлежат классу Y=0. Тестовая выборка состоит из элементов (A, B, C, N). Необходимо определить принадлежность каждого элемента тестовой выборки либо классу Y=1, либо Y=0. Какой метод анализа здесь будет наиболее эффективен? Какой вы можете посоветовать программный продукт для работы с такими выборками? Заранее благодарен.