В процессе подготовки данных иногда приходится использовать группировку по одному или нескольким полям. Однако впоследствии возникает потребность вернуться на исходный уровень детализации. Как распределить значения полей в требуемом наборе данных? Этот вопрос решает обработчик Разгруппировка.
При прогнозировании продаж бывает затруднительно обучить модель по некоторым товарным позициям в силу малого количества данных по ним. Выход из данной ситуации — получить прогноз по группам товаров.
Однако в исходной задаче требуется получения прогноза по каждой позиции. Для этого используется обработчик Разгруппировка, который распределяет число продаж из группы товаров по отдельным позициям.
Принцип работы разгруппировки состоит в следующем. На основании указанных параметров строится список значений восстанавливаемого измерения и вычисляется оценка распределения значений фактов: для каждого значения восстанавливаемого измерения вычисляется отношение факта к сумме всех его значений по всей выборке или ее части.
После этого в набор данных, к которому применяется разгруппировка, добавляется восстанавливаемое поле. Каждая строка этого набора данных заменяется на группу строк, содержащих соответствующие значения в полях существующих измерений и по одному значению из списка для восстанавливаемого измерения.