피셔의 정확 검정이란?
피셔의 정확 검정(Fisher's Exact Test)은 2x2 분할표에서 두 범주형 변수 사이에 연관성이 있는지를 확인하는 통계 검정입니다. 카이제곱 검정과 달리 근삿값이 아닌 정확한 p-값을 직접 계산하기 때문에, 표본 수가 적거나 셀의 기대 빈도가 낮은 경우에 특히 적합합니다. 생물학, 의학, 사회과학 등 다양한 분야에서 폭넓게 활용됩니다.
계산기 사용 방법
2x2 표의 네 개 셀 값을 입력하세요. a와 b는 첫 번째 행을, c와 d는 두 번째 행을 구성합니다. 계산기는 관측된 표의 정확한 초기하분포 확률과 함께 양측 p-값을 계산합니다. 양측 p-값은 행과 열 합계가 동일한 모든 표 중에서, 관측된 표보다 발생 확률이 높지 않은 표들의 확률을 모두 합산한 값입니다.
공식 설명
주변 합계(margin)가 고정된 상태에서 특정 표가 나타날 확률은 초기하분포를 따릅니다:
$$p = \dfrac{(a+b)!\,(c+d)!\,(a+c)!\,(b+d)!}{n!\;a!\,b!\,c!\,d!}$$이며, 여기서 \(n = a + b + c + d\) 입니다. 양측 p-값은 동일한 주변 합계를 가지면서 관측된 확률보다 작거나 같은 모든 표의 p 값을 합산하여 구합니다.
$$P_{\text{two-sided}} = \sum_{\,p_i \le p_{\text{obs}}} p_i$$
예제로 살펴보기
\(a = 8\), \(b = 2\), \(c = 1\), \(d = 5\) (\(n = 16\))인 표를 예로 들어보겠습니다. 이 표가 정확히 나타날 확률은 약 \(0.01865\)입니다. 그리고 발생 확률이 이와 같거나 더 낮은 모든 표를 합산하면 양측 p-값은 대략 \(0.0349\)가 됩니다. 이는 유의수준 \(0.05\)에서 통계적으로 유의한 연관성이 있음을 시사합니다.
자주 묻는 질문(FAQ)
카이제곱 검정 대신 피셔의 검정을 언제 써야 하나요? 표본 수가 적거나 어느 한 셀의 기대 빈도가 5 미만일 때 피셔의 정확 검정을 사용하세요. 이런 경우 카이제곱 근사가 신뢰하기 어렵기 때문입니다.
양측 p-값은 무엇을 의미하나요? 두 변수 사이에 연관성이 없다는 가정 하에, 양쪽 방향 모두에서 관측값만큼 또는 그보다 더 극단적인 표가 나타날 확률을 뜻합니다.
더 큰 표도 분석할 수 있나요? 이 계산기는 2x2 표를 처리합니다. 더 큰 분할표는 일반화된 정확 검정이 필요합니다.