Вход
Регистрация

Разгруппировка

Назначение

В процессе подготовки данных иногда приходится использовать группировку по одному или нескольким полям. Однако впоследствии возникает потребность вернуться на исходный уровень детализации. Как распределить значения полей в требуемом наборе данных? Этот вопрос решает обработчик Разгруппировка.

Пример применения

При прогнозировании продаж бывает затруднительно обучить модель по некоторым товарным позициям в силу малого количества данных по ним. Выход из данной ситуации — получить прогноз по группам товаров.

Однако в исходной задаче требуется получения прогноза по каждой позиции. Для этого используется обработчик Разгруппировка, который распределяет число продаж из группы товаров по отдельным позициям.

Алгоритм обработки

Принцип работы разгруппировки состоит в следующем. На основании указанных параметров строится список значений восстанавливаемого измерения и вычисляется оценка распределения значений фактов: для каждого значения восстанавливаемого измерения вычисляется отношение факта к сумме всех его значений по всей выборке или ее части.

После этого в набор данных, к которому применяется разгруппировка, добавляется восстанавливаемое поле. Каждая строка этого набора данных заменяется на группу строк, содержащих соответствующие значения в полях существующих измерений и по одному значению из списка для восстанавливаемого измерения.

Рассылка материалы о Loginom