Матрица издержек классификации (Cost-matrix)

Loginom: Логистическая регрессия (обработчик), Нейросеть (классификация) (обработчик)

Разновидность таблицы сопряженности, в которой для каждого типа ошибок указываются издержки классификации в денежном, количественном выражении или в виде весов.

В таблице приведен пример для случая бинарной классификации, где в ячейках, в которых указывается число неправильно классифицированных наблюдений (они расположены вне главной диагонали таблицы), указываются значения издержки каждой неправильной классификации. Если модель «перепутает» Класс 1 с Классом 2, то стоимость такой ошибки будет 100, а если Класс 2 с Классом 1 — 50.

Модель / Факт Класс 1 Класс 2
Класс 1 50
Класс 2 100  

Умножив число ошибок на соответствующие значения стоимости и сложив результаты, можно вычислить общие издержки классификации. Затем можно оптимизировать модель так, чтобы уменьшить число ошибок, вносящих наибольший вклад в суммарные издержки.