Вход
Регистрация

балансировка выборки для лог-регрессии

Добрый день!

Подскажите обязательно ли делать балансировку выборки при построении модели лог-регрессии, если TRUE события в наборе данных составляют от 3% до 10%?
Второй вопрос: есть два способа балансировать данные - увеличивать (создавать дубликаты) TRUE события, или уменьшать FALSE события. Какой способ предпочтительнее?