Вход
Регистрация

Группировка

Очень часто для принятия решения необходима агрегированная информация, т.е. сгруппированные данные. Например, объемы продаж за месяц, средняя цена товаров данной категории и т.п.

За счет объединения значений измерений группировка позволяет оптимизировать представление анализируемых данных с точки зрения эффективности анализа и интерпретируемости его результатов. Кроме того, группировка дает возможность снизить количество наблюдений, которые необходимо обработать в процессе анализа, а значит, уменьшить время и вычислительные затраты на его выполнение.

Для приведения информации к минимально необходимому количеству полей и значений используются следующие варианты агрегации:

  • Минимум;
  • Максимум;
  • Среднее;
  • Стандартное отклонение;
  • Медиана;
  • Сумма;
  • Сумма квадратов;
  • Количество уникальных значений;
  • Количество пропусков;
  • Первый;
  • Последний.

Также существует возможность выполнения обратной операции - разгруппировки, которая позволяет восстановить измерения, исключенные из выборки при группировке. При этом значения имеющихся измерений остаются неизменными, а значения фактов разделяются в определенной пропорции.

Рассылка материалы о Loginom