Индекс Джини (Gini index)

Разделы: Метрики

Loginom: Качество бинарной классификации (визуализатор)

Индекс Джини — это статистический показатель, с помощью которого можно описывать характер изменения одной величины относительно изменения другой. Основным применением индекса Джини является оценка неравномерности распределения изучаемого признака (например, годового дохода) для различных социальных групп.

Этот метод был разработан итальянским статистиком и демографом Коррадо Джини (1884–1965) и впервые опубликован в 1912 г. В настоящее время индекс Джини широко применяется в экономических, социальных и демографических исследованиях.

Если одна исследуемая величина равномерно изменяется при вариации другой, то соответствующая зависимость может быть представлена с помощью линии в системе координат, где по осям откладываются значения величин, упорядоченные по возрастанию и обычно выражаемые в процентах.

На рисунке показано распределение совокупного дохода страны в обществе. Диагональная прямая соответствует равномерному распределению дохода.

Индекс Джини

Если распределение доходов подчиняется данной прямой, то расслоение по уровню доходов в обществе отсутствует (линия справедливости). В противном случае оно будет описываться некоторой кривой, которая проходит выше или ниже прямой линии и называется кривой Лоренца.

Индекс Джини численно равен отношению площади фигуры, образованной кривой Лоренца и кривой равенства (залитая область на рис.), к площади треугольника ABC. Очевидно, что он может принимать значения от 0 до 1 и будет отражать степень неравномерности распределения доходов в обществе.