단일 비율 Z-검정이란?
단일 비율 z-검정(단일 표본 비율 검정이라고도 합니다)은 모집단의 비율이 이미 알려진 값이나 가정한 값과 다른지를 확인하는 검정입니다. 예/아니오, 합격/불합격, 성공/실패처럼 두 가지 결과로 나뉘는 데이터 분석에 널리 쓰입니다. 예를 들어 동전이 공정한지, 전환율(conversion rate)이 기준치를 넘어서는지, 불량률이 목표치를 충족하는지 등을 검정할 때 활용합니다.
계산기 사용 방법
성공 횟수(\(x\)), 전체 표본 크기(\(n\)), 가설 비율(\(p_0\), 0과 1 사이의 값)을 입력하세요. 그다음 대립가설을 선택합니다. 양측검정(실제 비율이 단순히 \(p_0\)와 다름), 좌측검정(\(p_0\)보다 작음), 우측검정(\(p_0\)보다 큼) 중에서 고르면 됩니다. 계산기는 표본 비율, 표준오차, z 통계량, 그리고 이에 대응하는 p-값을 함께 보여 줍니다.
공식 설명
검정 통계량은 다음과 같습니다.
$$z = \dfrac{\hat{p} - \text{p}_0}{\sqrt{\dfrac{\text{p}_0\left(1 - \text{p}_0\right)}{\text{n}}}} \qquad \hat{p} = \dfrac{\text{x}}{\text{n}}$$여기서 \(\hat{p} = x/n\) 은 표본 비율입니다. 분모는 귀무가설 아래에서 계산한 비율의 표준오차이며, 이 때문에 \(\hat{p}\) 가 아니라 \(p_0\) 를 사용합니다. 이렇게 구한 \(z\) 값을 표준정규분포와 비교하여 p-값을 얻습니다. 정규근사는 \(n\cdot p_0\) 와 \(n\cdot(1 - p_0)\) 가 모두 대략 5~10 이상일 때 신뢰할 수 있습니다.
예제 풀이
유권자 100명 중 55명이 어떤 안건에 찬성한다고 가정하고, \(p_0 = 0.5\) 에 대해 양측 대립가설로 검정해 봅시다. 이때 \(\hat{p} = 0.55\), 표준오차 \(= \sqrt{0.5\cdot 0.5/100} = 0.05\),
$$z = \dfrac{0.55 - 0.5}{0.05} = 1.0$$이 됩니다. 양측 p-값은 약 0.317 이므로, 유의수준 \(\alpha = 0.05\) 에서는 귀무가설을 기각하지 않습니다.
자주 묻는 질문
표본 크기는 어느 정도가 적당한가요? 정규근사가 성립하도록 \(n\cdot p_0 \geq 5\) 와 \(n\cdot(1 - p_0) \geq 5\) 를 만족시키세요. 이 조건을 충족하지 못하면 정확검정인 이항검정(exact binomial test)을 사용하는 것이 좋습니다.
단측검정과 양측검정 중 무엇을 써야 하나요? 데이터를 수집하기 전에 방향이 정해진 가설이 있는 경우가 아니라면 양측검정을 사용하세요.
p-값은 어떻게 해석하나요? p-값이 설정한 유의수준(보통 0.05)보다 작으면, 실제 비율이 \(p_0\) 와 같다는 귀무가설을 기각합니다.