Что такое точный тест Фишера?
Точный тест Фишера проверяет, связаны ли между собой две категориальные переменные в таблице сопряжённости 2×2. В отличие от критерия хи-квадрат, он вычисляет не приближённое, а точное p-значение, поэтому отлично подходит для малых выборок и таблиц с низкими ожидаемыми частотами в ячейках. Тест широко применяется в биологии, медицине и социальных науках.
Как пользоваться калькулятором
Введите четыре значения ячеек вашей таблицы 2×2: \(a\) и \(b\) образуют первую строку, \(c\) и \(d\) — вторую. Калькулятор рассчитает точную гипергеометрическую вероятность наблюдаемой таблицы и двусторонний p-уровень, который суммирует вероятности всех таблиц (с теми же суммами по строкам и столбцам), вероятность которых не превышает вероятности вашей.
Разбор формулы
При фиксированных маргинальных суммах вероятность любой конкретной таблицы подчиняется гипергеометрическому распределению:
$$p = \dfrac{(a+b)!\,(c+d)!\,(a+c)!\,(b+d)!}{n!\;a!\,b!\,c!\,d!}$$где \(n = a + b + c + d\). Двусторонний p-уровень складывает значения \(p\) по всем таблицам с теми же маргинальными суммами, чья вероятность меньше или равна наблюдаемой.
$$P_{\text{two-sided}} = \sum_{\,p_i \le p_{\text{obs}}} p_i$$
Пример расчёта
Для таблицы \(a = 8\), \(b = 2\), \(c = 1\), \(d = 5\) (\(n = 16\)) вероятность именно этой таблицы составляет примерно \(0{,}01865\). Суммируя все столь же или менее вероятные таблицы, получаем двусторонний p-уровень около \(0{,}0349\) — это указывает на статистически значимую связь на уровне \(0{,}05\).
Частые вопросы
Когда выбирать тест Фишера вместо хи-квадрат? Используйте точный тест Фишера при малых объёмах выборки или когда хотя бы одна ожидаемая частота в ячейке меньше 5 — в таких случаях приближение хи-квадрат ненадёжно.
Что означает двусторонний p-уровень? Это вероятность получить таблицу, как минимум столь же экстремальную, как ваша, в любую из сторон, при условии отсутствия связи между переменными.
Подходит ли тест для таблиц большего размера? Этот калькулятор работает с таблицами 2×2. Для более крупных таблиц сопряжённости нужны обобщённые точные тесты.