Квантование (Binning)

Синонимы: Дискретизация

Разделы: Алгоритмы

Loginom: Квантование (обработчик), Конечные классы (обработчик)

Процесс обработки данных, который преобразует непрерывные данные в дискретные путем замены значений отрезками, каждый из которых представляет некоторый диапазон.

Квантование (Binning)

Квантование может использоваться для сокращения размерности данных, а именно для уменьшения числа разнообразных значений признака.

При квантовании производится отображение всевозможных значений величины на дискретную область, состоящую из величин уровня квантования.

Например, если с точки зрения анализа нет разницы между числом новых посетителей в 15 и 17 тыс., то нет смысла рассматривать эти величины отдельно. В этом случае лучший результат даст квантование: оно позволяет представлять информацию в более компактном и удобном для анализа виде.

Различают два основных метода квантования:

  • интервальный;
  • квантильный.

При интервальном квантовании диапазон изменения значения признака разделяется на равные интервалы. Данный метод используется, если значения равномерно распределены по всему диапазону их изменения, т.е. в результате квантования не будет интервалов, в которых значения почти отсутствуют или заполнены очень плотно.

При квантильном методе ширина интервалов может быть различной. Ее выбирают таким образом, чтобы в каждый из них попало примерно одинаковое количество значений.