Нормирование нелинейное (Non-linear normalization)

Синонимы: Нормализация нелинейная

Нелинейное нормирование — это приведение исходного диапазона изменения величины, используемой в аналитической модели, к некоторому «нормальному» диапазону (например [0..1] или [-1..1]) с использованием нелинейной функции.

Необходимость нормирования обусловлена тем, что переменные, поступающие на вход аналитической модели, могут иметь различную физическую природу и быть представлены в разных шкалах. Например, при анализе перевозок могут использоваться такие показатели, как дальность перевозки (десятки и сотни километров), вес перевезённых грузов (тысячи тонн) и стоимость груза (миллионы и десятки миллионов рублей).

Очевидно, что размах вариации наблюдаемых значений этих переменных различается на порядки: для дальности это единицы и десятки, а для стоимости — миллионы. Если целью модели является определение влияния изменчивости входных переменных на изменчивость выходной (как, например, в регрессии), то окажется, что наибольшее влияние будет у входной переменной с большей вариативностью, даже если это противоречит реальной ситуации.

Для решения данной проблемы и используют нормирование — приведение входных переменных к одному диапазону. Для этого применяют специальную нормирующую функцию, которая «сжимает» или расширяет исходный диапазон к нормальному и которая может быть линейной или нелинейной. Соответственно, и нормирование будет называться линейным или нелинейным.

При нормировании нужно точно знать теоретически возможный максимальный диапазон изменения величины. Однако, если он неизвестен, то в качестве исходного диапазона приходится использовать разность между наблюдаемыми минимумом и максимумом.

В случае нелинейной нормализации различные интервалы исходного диапазона «сжимаются» с различной степенью, что в некоторых случаях позволяет добиться наилучшего результата, подбирая параметры, управляющие формой нормирующей функции.

Наиболее распространёнными нелинейными нормирующими функциями являются сигмоиды — логистическая и гиперболический тангенс. Первая приводит значения к диапазону [0..1], а вторая — [-1..1].

Пусть $x_{i k}$ — $i$ -е входное значение $k$ -го примера в исходных шкалах набора данных. ${~ x}_{i k}$ — соответствующие им нормализованное входное значение.

Тогда переход от исходных значений к нормализованным с использованием нелинейной нормализации осуществляется с использованием логистической функции, определяется выражением:

${~ x}_{i k} = \frac{1}{1 + e x p (- a (x_{i k} - x_{c i}))}$ ,

где $x_{c i}$ — центр нормализуемого интервала, $a$ — параметр крутизны функции.

Сигмоидальные функции используются для нормирования выходов нейронов в нейронных сетях.