Вход
Регистрация

Разбиение на множества

Модель, построенная на некотором множестве данных, описывающих реальный объект или систему, может оказаться не работающей на практике, поэтому в моделировании используется специальные приемы, в том числе оценка обобщающей способности модели.

Чтобы проверить способность модели к обобщению, используется обработчик Разбиение на множества. Он позволяет разделить исходный набор данных на два подмножества:

  • Обучающее. Используется непосредственно для обучения модели;
  • Тестовое. Для обучения не применяется, используется для проверки обобщающей способности модели.
Использование Разбиение на множества при построении скоринговой карты

Тестовое множество получается путем вычитания из исходной совокупности обучающего множества, которое в свою очередь формируется посредством процедуры Сэмплинга.

Наиболее часто данный обработчик используется для подготовки данных перед построением аналитических моделей: нейронных сетей, деревьев решений, карт Кохонена, логистической регрессии...