Добрый день!
Подскажите обязательно ли делать балансировку выборки при построении модели лог-регрессии, если TRUE события в наборе данных составляют от 3% до 10%?
Второй вопрос: есть два способа балансировать данные - увеличивать (создавать дубликаты) TRUE события, или уменьшать FALSE события. Какой способ предпочтительнее?