Вход
Регистрация

Деревья решений

Господа, кто-нибудь пробовал алгоритм CWS Домингоса или читал о сравнениях CWS с современными с ним алгоритмами (SLIQ и SPRINT Агравала с компанией, MIND) или еще более свежими, а не со старыми алгоритмами наподобие С4.5, CART, MARS?
И вообще, какой алгоритм сейчас считается самым быстрым? Мои требования такие: скорость на однопроцессорном компе и возможность обработать на нем таблицы размером до пары лимонов записей, устойчивость к шуму (отсутствие роста числа правил при увеличении степени зашумления выборки), малое число итоговых правил нужны в первую очередь, хорошая масштабируемость на большое число процессоров - во вторую. Типология независимых признаков разная - булевы-номинальные и непрерывные.
Свалилось сразу несколько задачек, которые по разным причинам хочется посмотреть именно "деревянными" методами. Из приемлемых алгоритмов, описания которых быстро откопал в интернете, понравился именно CWS.