Что такое критерий независимости хи-квадрат?
Критерий хи-квадрат (χ²) проверяет, связаны ли между собой две категориальные переменные. Для таблицы сопряжённости 2×2 он сравнивает фактически наблюдаемые частоты с теми, которых стоило бы ожидать, если бы переменные были полностью независимы. Чем сильнее расхождение, тем больше значение χ² — и тем больше оснований полагать, что между переменными есть связь.
Как пользоваться калькулятором
Введите четыре частоты вашей таблицы 2×2: A и B образуют первую строку, C и D — вторую. Калькулятор подсчитает суммы по строкам, по столбцам и общий итог, вычислит ожидаемую частоту для каждой ячейки и сложит стандартизованные квадраты отклонений, получив χ². Кроме того, он покажет число степеней свободы (для таблицы 2×2 оно всегда равно 1), приближённое p-значение, критическое значение для уровня 0,05 и вывод о том, является ли результат статистически значимым.
Разбор формулы
Для каждой ячейки ожидаемая частота равна \(E = (\text{сумма по строке} \times \text{сумма по столбцу}) / \text{общий итог}\). Сама статистика критерия вычисляется как
$$\chi^2 = \sum \frac{(O - E)^2}{E}$$по всем четырём ячейкам. При одной степени свободы критическое значение на уровне значимости 5 % составляет 3,841. Если ваше χ² превышает 3,841, нулевая гипотеза о независимости отвергается.
Пример расчёта
Пусть \(A = 10\), \(B = 20\), \(C = 30\), \(D = 40\). Суммы по строкам — 30 и 70; по столбцам — 40 и 60; общий итог — 100. Ожидаемые значения: 12, 18, 28, 42. Тогда
$$\chi^2 = \frac{(10-12)^2}{12} + \frac{(20-18)^2}{18} + \frac{(30-28)^2}{28} + \frac{(40-42)^2}{42} \approx 0{,}3333 + 0{,}2222 + 0{,}1429 + 0{,}0952 \approx 0{,}7937$$Поскольку 0,79 < 3,841, отвергнуть гипотезу о независимости мы не можем.
Частые вопросы
Почему число степеней свободы здесь всегда равно 1? Степени свободы \(= (\text{строки} - 1)(\text{столбцы} - 1) = (2-1)(2-1) = 1\).
Что означает малое p-значение? Если p-значение меньше 0,05, то наблюдаемая связь маловероятна при условии независимости переменных, а значит, они, скорее всего, связаны.
Точное ли это p-значение? Калькулятор использует стандартное численное приближение распределения хи-квадрат с одной степенью свободы. Для обычных решений его точности достаточно, но в пограничных случаях оно не заменит полноценный статистический пакет.