Фиктивная переменная (Dummy variable)

Синонимы: Индикаторная переменная, Indicator variable

Фиктивная переменная — это бинарная переменная, которая вводится как вспомогательная в статистические модели, особенно регрессионные.

Принимая значения 0 или 1, фиктивная переменная отражает наличие или отсутствие влияния некоторого категориального признака на выход модели. Например, если дискретный признак является бинарным (допустим, «Пол»), то в простейшем случае можно ввести фиктивную переменную, которая для значения «Мужской» будет принимать значение 0, а для значения «Женский» — 1.

Термин «фиктивные переменные» используется в основном в статистике. В технологиях Data Mining применяется аналогичное понятие — кодирование категориальных значений, в частности, с помощью битовой маски. Если дискретная переменная принимает несколько значений, то каждое из них может быть закодировано уникальной комбинацией нулей и единиц.