Куб (Cube)

Синонимы: Сводная таблица, Гиперкуб, Многомерный куб, OLAP-куб, Hypercube

Разделы: Визуализация

Куб представляет собой многомерный массив данных, используемый в системах оперативной аналитической обработки (OLAP). Кроме этого, куб можно рассматривать как модель данных, обеспечивающую функциональность OLAP.

В основе идеи построения куба лежит многомерная модель данных, предполагающая их разделение на измерения и факты. Куб, который содержит более чем три измерения, называется многомерным.

Куб можно рассматривать как многомерное обобщение двумерной электронной таблицы. При этом измерения образуют оси многомерной модели данных (ребра куба), а факты — ячейки внутри куба, расположенные на пересечении соответствующих значений измерений.

На рисунке представлен пример 3-мерного куба, содержащего измерения «Товар», «Месяц» и «Город».

OLAP-куб

Представление данных в виде куба обеспечивает возможность реализации концептуально простых операций для поддержки процесса анализа — срез и фрагментацию, детализацию, свертывание и вращение:

  • Срез (slice) — извлечение из куба подмножества ячеек, связанных с каким-либо значением одного из его измерений. Например, срез по значению «Февраль» измерения «Месяц» (см. рис.) позволяет получить данные по продажам всех товаров во всех городах. Фактически, срез можно рассматривать как одномерный куб, который можно представить в виде обычной плоской таблицы. Использование срезов позволяет выполнить декомпозицию задачи анализа сложных многомерных структур на несколько более простых одномерных задач.
  • Фрагментация (dice) — извлечение из куба некоторого подкуба, содержащего только те значения измерений, которые нужны для анализа. Например, фрагмент куба может содержать данные только за определенный интервал дат или о продажах по заданным городам.
  • Детализация (Drill Down/Up) — позволяет аналитику изменять уровень представления данных в кубе от более общего к более детальному (down) или наоборот (up).
  • Свертывание (RollUp)агрегирование данных по одному или нескольким измерениям. Производится в том случае, если нужны сводные, а не полные данные.
  • Вращение (pivot) — позволяет менять пространственную ориентацию осей измерений куба, выбирая наиболее удобное для аналитика представление.

В OLAP-технологиях куб — это прежде всего средство визуализации многомерных данных. Поэтому при его использовании приходится решать задачу отображения информации в удобном и интерпретируемом для человека виде.

Для представления данных в кубе разработан специальный визуализатор, называемый кросс-таблицей. Она представляет данные в виде таблицы, но снабжена специальным интерфейсом, который позволяет оперативно группировать измерения, управлять срезами куба и отображать их на плоскости.

Кросс-таблица

Таким образом, кросс-таблица позволяет заменить сложное, трудно интерпретируемое многомерное представление множеством «плоских», но более простых и понятных.

Впервые концепция OLAP-кубов была описана Эдгаром Коддом.

В Loginom встроен визуализатор OLAP-куб, который служит удобным средством отображения и манипуляции многомерных данных.