두 비율 Z-검정이란?
두 비율 Z-검정은 두 표본 비율의 차이가 통계적으로 유의한지 확인하는 검정입니다. A/B 테스트는 물론, 두 독립 집단의 전환율, 응답률, 불량률, 성공률 등을 비교할 때 가장 널리 쓰이는 표준 도구입니다. 귀무가설에서는 두 모집단의 비율이 같다고 가정하기 때문에, 두 표본을 하나로 합쳐(pooling) 공통 비율을 추정합니다.
계산기 사용 방법
두 집단 각각에 대해 "성공" 횟수(예: 전환 수, 긍정 응답 수)와 전체 표본 크기를 입력하세요. 계산기는 z 통계량, 양측 p값, 각 집단의 표본 비율, 합동 비율(pooled proportion), 표준오차를 함께 보여줍니다. 산출된 p값을 유의수준(보통 0.05)과 비교하면 됩니다. p값이 유의수준보다 작으면 두 비율의 차이는 통계적으로 유의합니다.
공식 풀이
먼저 각 표본 비율을 구합니다: \(\hat{p}_1 = x_1/n_1\), \(\hat{p}_2 = x_2/n_2\). 귀무가설 아래에서 합동 비율은 \(\hat{p} = (x_1 + x_2)/(n_1 + n_2)\)입니다. 차이의 표준오차는 다음과 같이 계산합니다:
$$\text{SE} = \sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}$$마지막으로 \(z = (\hat{p}_1 - \hat{p}_2) / \text{SE}\)를 구합니다.
$$z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}$$양측 p값은 표준정규분포에서 \(2 \times P(Z > |z|)\)로 얻습니다.
예제로 살펴보기
집단 1이 100명 중 45명 성공(\(\hat{p}_1 = 0.45\)), 집단 2가 100명 중 30명 성공(\(\hat{p}_2 = 0.30\))이라고 가정해 봅시다. 합동 비율은 \((45+30)/(100+100) = 0.375\)입니다.
$$\text{SE} = \sqrt{0.375 \times 0.625 \times (0.01 + 0.01)} = \sqrt{0.0046875} \approx 0.06847$$따라서
$$z = \frac{0.45 - 0.30}{0.06847} \approx 2.191$$이며, 이때 양측 p값은 약 0.0285로 — 5% 유의수준에서 유의한 결과입니다.
자주 묻는 질문
합동(pooled) 검정과 비합동(unpooled) 검정 중 언제 무엇을 써야 하나요? 여기서 사용하는 합동 방식은 귀무가설 아래에서 두 비율이 같다고 가정하며, 가설 검정의 표준입니다. 비합동 표준오차는 보통 신뢰구간을 구할 때 사용합니다.
표본 크기는 얼마나 필요한가요? 정규근사는 각 집단에서 기대 성공 수와 실패 수가 모두 최소 약 5~10 이상일 때 잘 작동합니다.
p값은 단측인가요, 양측인가요? 이 계산기는 양측 p값을 제공하며, 두 비율이 어느 방향으로든 다른지를 검정합니다.