Хи-квадрат критерий (Chi-square test)

Синонимы: Критерий согласия Пирсона

Разделы: Метрики

Loginom: Отчет по регрессии

Критерий согласия для проверки гипотезы о законе распределения исследуемой случайной величины. Во многих практических задачах точный закон распределения неизвестен. Поэтому выдвигается гипотеза о соответствии имеющегося эмпирического закона, построенного по наблюдениям, некоторому теоретическому. Данная гипотеза требует статистической проверки, по результатам которой будет либо подтверждена, либо опровергнута.

Пусть — исследуемая случайная величина. Требуется проверить гипотезу о том, что данная случайная величина подчиняется закону распределения . Для этого необходимо произвести выборку из независимых наблюдений над случайной величиной : , и по ней построить эмпирический закон распределения случайной величины .

Гипотеза : порождается функцией .

Разделим на непересекающихся интервалов .

Пусть — количество наблюдений в j-м интервале;

— вероятность попадания наблюдения в j-й интервал при выполнении гипотезы ;

— ожидаемое число попаданий в j-й интервал;

тогда распределение Хи-квадрат с числом степеней свободы будет иметь следующую статистику:

В зависимости от значения критерия гипотеза может приниматься либо отвергаться:

  • — гипотеза выполняется.
  • — попадает в левый «хвост» распределения. Следовательно, теоретические и практические значения очень близки. Если, к примеру, происходит проверка генератора случайных чисел, который сгенерировал чисел из отрезка [0,1] и выборка распределена равномерно на [0,1], то генератор нельзя называть случайным (гипотеза случайности не выполняется), т.к. выборка распределена слишком равномерно, но гипотеза выполняется.
  • — попадает в правый «хвост» распределения, гипотеза отвергается.