초기하분포란?
초기하분포는 K개의 성공(원하는 항목)이 포함된 크기 N의 유한 모집단에서 비복원추출로 n번을 뽑았을 때, 정확히 k번 성공할 확률을 나타내는 분포입니다. 복원추출을 가정하고 매 시행의 확률이 일정한 이항분포와 달리, 초기하분포는 한 번 뽑을 때마다 남아 있는 모집단의 구성이 달라진다는 점을 반영합니다.
계산기 사용 방법
네 개의 정수를 입력하세요. 모집단 크기 N, 모집단 내 성공 개수 K, 표본 크기 n, 그리고 관측된 성공 횟수 k입니다. 그러면 정확한 확률 \(P(X = k)\)와 누적확률 \(P(X \le k)\), \(P(X \ge k)\), 분포의 평균과 분산이 함께 계산되어 나옵니다.
공식 풀어보기
\(P(X = k)\)는 K개의 성공 중 k개를 고르는 경우의 수에, N−K개의 실패 중 나머지 n−k개를 고르는 경우의 수를 곱한 다음, N개 중 n개를 고르는 전체 경우의 수로 나눈 값입니다.
$$P(X = \text{k}) = \dfrac{\dbinom{\text{K}}{\text{k}}\dbinom{\text{N}-\text{K}}{\text{n}-\text{k}}}{\dbinom{\text{N}}{\text{n}}}$$평균은 \(\mu = \text{n}\,\dfrac{\text{K}}{\text{N}}\)이고, 분산은 \(\sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1}\)입니다. 마지막 항인 \(\dfrac{\text{N}-\text{n}}{\text{N}-1}\)이 바로 유한모집단 수정계수입니다.
$$\begin{gathered} \mu = \text{n}\,\dfrac{\text{K}}{\text{N}} \\[1em] \sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1} \end{gathered}$$
예제로 살펴보기
일반적인 52장짜리 카드 한 벌에는 에이스가 \(K=4\)장 들어 있습니다. 여기서 \(n=5\)장을 뽑는다고 해봅시다. 정확히 \(k=2\)장이 에이스일 확률은 $$\dfrac{C(4,2)\cdot C(48,3)}{C(52,5)} = \dfrac{6\cdot 17296}{2598960} \approx 0.039929$$입니다. 그리고 뽑힐 에이스의 기댓값은 \(5\cdot\dfrac{4}{52} \approx 0.3846\)장입니다.
자주 묻는 질문
이항분포 대신 초기하분포를 써야 할 때는 언제인가요? 크기가 작은 유한 모집단에서 비복원추출을 할 때는 초기하분포를 사용하세요. 시행이 서로 독립이거나 모집단이 사실상 무한히 클 때는 이항분포를 쓰면 됩니다.
\(P(X \ge k)\)는 무슨 뜻인가요? 최소 k번 이상 성공할 확률을 의미합니다. 품질관리의 합격판정 샘플링처럼 분포의 꼬리 부분을 검정할 때 유용합니다.
k가 K나 n보다 클 수도 있나요? k가 K와 n 중 작은 값보다 크면, 그런 결과는 애초에 일어날 수 없으므로 확률은 0이 됩니다.