표본평균의 표집분포란?
크기가 n인 무작위 표본을 모집단에서 반복해서 뽑고 각 표본의 평균을 계산하면, 이 평균값들이 모여 또 하나의 분포를 이룹니다. 이것이 바로 표본평균의 표집분포입니다. 이 계산기는 세 가지 값, 즉 모집단 평균 \(\mu\), 모집단 표준편차 \(\sigma\), 표본 크기 \(n\)만 입력하면 표집분포의 중심(평균)과 퍼짐(표준오차)을 구해 줍니다.
계산기 사용 방법
모집단 평균(\(\mu\)), 모집단 표준편차(\(\sigma\)), 표본 크기(\(n\))를 입력하세요. 그러면 표집분포의 평균(\(\mu_{\bar{x}}\)), 표준오차(\(\sigma_{\bar{x}}\)), 표본평균의 분산(\(\sigma_{\bar{x}}^{2}\))이 함께 나옵니다. 표준오차는 표본평균들이 실제 모집단 평균에서 보통 얼마나 떨어져 흩어지는지를 알려 주는 값입니다.
공식 풀이
표집분포의 평균은 언제나 모집단 평균과 같습니다. 즉 \(\mu_{\bar{x}} = \mu\)입니다. 반면 퍼짐은 표본이 커질수록 줄어듭니다:
$$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$$\(n\)의 제곱근으로 나누기 때문에, 표본 크기를 두 배로 늘려도 표준오차는 절반이 되지 않습니다. 표준오차를 절반으로 줄이려면 \(n\)을 4배로 늘려야 합니다. 또한 중심극한정리에 따르면, \(n\)이 충분히 크면 모집단의 모양과 상관없이 이 분포는 근사적으로 정규분포를 따릅니다.
예제로 풀어 보기
\(\mu = 100\), \(\sigma = 15\), \(n = 25\)라고 해 봅시다. 그러면 \(\mu_{\bar{x}} = 100\)이고,
$$\sigma_{\bar{x}} = \frac{15}{\sqrt{25}} = \frac{15}{5} = 3$$입니다. 분산은 \(\sigma_{\bar{x}}^{2} = 3^{2} = 9\)이 됩니다. 즉 관측값 25개로 이루어진 표본평균들은 표준오차 3을 갖고 100 주변에 몰려 분포하게 됩니다.
자주 묻는 질문
표본이 커지면 왜 표준오차가 작아지나요? 표본이 클수록 우연한 변동이 서로 상쇄되어 평균값이 실제 평균 주위에 더 촘촘하게 모이기 때문입니다.
모집단이 반드시 정규분포여야 하나요? 여기서 쓰는 공식에는 그럴 필요가 없습니다. 평균과 표준오차는 어떤 모집단에서도 정확하게 성립합니다. 다만 표집분포가 정규분포에 가까워지는 것은 중심극한정리에 따라 \(n\)이 클 때 근사적으로 나타나는 성질입니다.
표본 표준편차밖에 모를 때는요? \(\sigma\)를 모를 때는 표본 표준편차 \(s\)를 추정값으로 사용하면 됩니다. 이때 표준오차는 \(s/\sqrt{n}\)이 되며, 보통 t-분포와 함께 사용합니다.