Мода распределения (Mode)

Разделы: Метрики

В статистике мода — это значение, которое случайная величина на заданном множестве наблюдений принимает наиболее часто. Мода образует пик на графике функции распределения. Если существуют несколько значений, которые встречаются значительно чаще, чем остальные, то у распределения может образовываться несколько мод (выраженных пиков).

Мода

Распределение с одной модой называется унимодальным, в противном случае — мультимодальным.

Для интервального ряда мода определяется по формуле:

,

— левая граница модального интервала, — длина модального интервала, — частота премодального интервала, — частота модального интервала, — частота послемодального интервала.

В отличие от среднего и медианы, понятие моды имеет смысл и для номинальных данных. В этом случае модой считается категория, которая встречается наиболее часто. Например, фамилия, которая встречается в списке чаще всех других.

С точки зрения анализа данных, мода несёт информацию о «типичных» значениях признака, а не о наиболее вероятных (как среднее).