Что такое статистика критерия хи-квадрат?
Статистика критерия хи-квадрат (\(\chi^2\)) показывает, насколько сильно набор наблюдаемых частот отклоняется от частот, которые мы ожидали бы получить при справедливости нулевой гипотезы. Она лежит в основе двух классических методов: критерия согласия хи-квадрат и критерия независимости хи-квадрат. Чем больше значение \(\chi^2\), тем сильнее расхождение между тем, что мы наблюдали, и тем, что ожидали увидеть, а значит, тем весомее аргументы против нулевой гипотезы.
Как пользоваться калькулятором
Введите наблюдаемые частоты через запятую, а затем — соответствующие ожидаемые частоты в том же порядке. Калькулятор сопоставит каждое наблюдаемое значение с его ожидаемым, вычислит вклад каждой категории и сложит их, получив итоговую статистику \(\chi^2\). Дополнительно он покажет число категорий (\(k\)) и число степеней свободы (\(k - 1\)) — именно по этим величинам вы найдёте критическое значение или p-значение в таблице распределения хи-квадрат.
Разбираем формулу
Статистика рассчитывается так:
$$\chi^{2} = \sum_{i=1}^{k} \frac{\left(\text{O}_i - \text{E}_i\right)^{2}}{\text{E}_i}$$Для каждой категории из наблюдаемого числа вычитают ожидаемое, возводят разность в квадрат (чтобы положительные и отрицательные отклонения не гасили друг друга) и делят на ожидаемое значение, приводя отклонение к единому масштабу. Сумма этих вкладов по всем категориям и даёт значение критерия. Важное условие: каждая ожидаемая частота должна быть больше нуля — категории с нулевым ожидаемым значением пропускаются, чтобы избежать деления на ноль.
Пример расчёта
Допустим, игральную кость бросили 100 раз и получили наблюдаемые частоты 30, 20, 25, 25, тогда как для честной кости ожидаемое значение в каждой категории равно 25. Вклады составят: \((30-25)^2/25 = 1\), \((20-25)^2/25 = 1\), \((25-25)^2/25 = 0\) и \((25-25)^2/25 = 0\). В сумме получаем \(\chi^2 = 2{,}0\) при 4 категориях и 3 степенях свободы.
Частые вопросы
О чём говорит высокое значение \(\chi^2\)? Оно указывает на большое расхождение между наблюдаемыми и ожидаемыми данными и даёт основания считать, что нулевая гипотеза, скорее всего, неверна.
Как получить p-значение? Сравните полученную статистику \(\chi^2\) с распределением хи-квадрат, используя указанное число степеней свободы, — по таблице или с помощью статистической программы.
Должны ли списки быть одинаковой длины? Да. У каждого наблюдаемого значения должно быть своё ожидаемое — калькулятор сопоставляет их по порядку.