비율의 오차한계란?
오차한계(MOE, Margin of Error)는 표본에서 얻은 비율이 실제 모집단의 비율과 얼마나 차이 날 수 있는지를 나타냅니다. 설문조사를 통해 응답자 중 비율 \(\hat{p}\)이 특정 선택지를 선호한다는 결과를 얻었을 때, 오차한계는 선택한 신뢰수준에서 이 추정값을 중심으로 한 ± 범위를 알려줍니다. 이 계산기는 특정 국가에 국한되지 않으며, 모든 설문조사나 여론조사에 보편적으로 적용할 수 있습니다.
사용 방법
표본 비율 \(\hat{p}\)을 0과 1 사이의 소수로 입력하고(예: 0.52는 52%를 의미합니다), 표본 크기 \(n\)을 입력한 뒤, 신뢰수준(90%, 95%, 99%)을 선택하세요. 계산기는 오차한계를 백분율로 보여주며, 표준오차, 사용된 \(z\) 임계값, 그리고 그 결과로 나온 신뢰구간을 함께 제공합니다. 또한 "5배 규칙"을 검증해 정규근사가 유효한지 여부도 확인해 줍니다.
공식 풀이
오차한계는 다음과 같이 구합니다.
$$\text{MOE} = z \cdot \sqrt{\dfrac{\hat{p}\,\left(1 - \hat{p}\right)}{n}}$$여기서 \(\sqrt{\hat{p}(1-\hat{p})/n}\) 항은 비율의 표준오차로, 표본 크기 \(n\)이 커질수록 작아집니다. \(z\) 값은 표준정규분포에서 얻은 임계값으로, 90% 신뢰수준에서는 \(1.645\), 95%에서는 \(1.96\), 99%에서는 \(2.576\)을 사용합니다. 표준오차에 \(z\)를 곱하면 원하는 확신 수준에 맞게 구간의 크기가 조정됩니다.
계산 예시
설문에 응한 유권자 1,000명 중 52%가 어떤 안건에 찬성한다고 가정해 봅시다. 즉 \(\hat{p} = 0.52\), \(n = 1000\)이고, 95% 신뢰수준(\(z = 1.96\))을 적용합니다. 표준오차는
$$\sqrt{\dfrac{0.52 \cdot 0.48}{1000}} = \sqrt{0.0002496} \approx 0.0158$$입니다. 오차한계는
$$1.96 \times 0.0158 \approx 0.0310$$즉 약 3.1%가 됩니다. 따라서 신뢰구간은 \(52\% \pm 3.1\%\)로, 대략 48.9%에서 55.1% 사이입니다.
자주 묻는 질문
5배 규칙이란 무엇인가요? 비율에 대한 정규근사는 \(n\cdot\hat{p} \geq 5\)와 \(n\cdot(1-\hat{p}) \geq 5\)를 모두 만족할 때 신뢰할 수 있다는 규칙입니다. 둘 중 하나라도 5보다 작으면 클로퍼–피어슨(Clopper–Pearson) 구간 같은 정확한(exact) 방법을 사용하는 것이 좋습니다.
모를 때 왜 \(\hat{p} = 0.5\)를 사용하나요? \(\hat{p}(1-\hat{p})\)는 0.5일 때 가장 커서 가장 보수적인(가장 넓은) 오차한계를 만들어냅니다. 이 때문에 표본 크기를 미리 계획할 때 흔히 0.5를 사용합니다.
표본이 커지면 오차한계가 줄어드나요? 네. \(n\)이 제곱근 아래 분모에 있기 때문에 오차한계는 \(1/\sqrt{n}\)에 비례해 감소합니다.