Нормирование линейное (Linear normalization)

Синонимы: Нормализация линейная

Нормирование данных заключается в приведении диапазона изменения значений признаков к некоторым требуемым границам (например, от 0 до 1). Нормирование является необходимым начальным этапом обработки данных при использовании многих многомерных статистических методов — снижения размерности признакового пространства, классификации и т.д., особенно если переменные измерены в шкалах, существенно различающихся в величинах (например, от миллиметров до километров).

Если связь между начальным и конечным диапазонами выражается линейной функцией, то нормирование является линейным (значение признаков по всему диапазону изменяются на одну и ту же величину). Если используется нелинейная функция (например, экспонента), то нелинейным (значения признаков, расположенные в различных частях диапазона, изменяются по разному).

Линейное нормирование

Линейное нормирование предпочтительно в том случае, когда значения переменной равномерно заполняют определенный интервал. Если в данных имеются редкие аномалии, намного превышающие типичный разброс, то в этих случаях следует ориентироваться при нормировке не на экстремальные (граничные) значения:

,

а на типичные значения — среднее:

и дисперсию:

.