기하분포란?
기하분포는 매 시행마다 성공확률이 동일하게 p인 독립적인 시행을 반복할 때, 첫 성공이 나오기 전까지 발생하는 실패 횟수를 모델링하는 분포입니다. 이 계산기는 "첫 성공 전까지의 실패 횟수" 정의를 사용하므로 확률변수 x는 0, 1, 2, … 의 값을 가지며, 확률질량함수는 \(f(x,p) = p(1-p)^{x}\) 입니다. 참고로, 첫 성공이 나온 시행 번호 k(k = 1, 2, …)를 세는 또 다른 일반적인 정의도 있지만, 이 계산기에서는 그 방식을 쓰지 않으며 둘 사이에는 \(x = k - 1\) 의 관계가 성립합니다.
계산기 사용법
첫 성공 전까지의 실패 횟수 x(0 이상의 정수)와 한 번 시행할 때의 성공확률 p(0과 1 사이의 값)를 입력하세요. 그러면 확률질량 \(f(x,p)\), 하측 누적확률 \(P(X \le x)\), 상측 누적확률 \(P(X \ge x)\), 그리고 평균(기대되는 실패 횟수)을 계산해 줍니다.
공식 풀이
\(q = 1 - p\) 라고 하겠습니다. 확률질량은 $$f(x,p) = p\cdot q^{x}$$ 입니다. 하측 누적합은 망원급수처럼 차례로 상쇄되어 $$P(X \le x) = 1 - q^{x+1}$$ 이 됩니다. 상측 꼬리는 $$P(X \ge x) = q^{x}$$ 입니다. 평균은 $$E[X] = \frac{1 - p}{p}$$ 입니다. 유용한 항등식으로 \(P(X \le x) + P(X \ge x) = 1 + f(x,p)\) 가 성립하는데, 이는 양쪽 꼬리가 모두 점 x를 한 번씩 포함하기 때문입니다.
계산 예시
x = 2, p = 0.4(따라서 q = 0.6)인 경우: $$f(2, 0.4) = 0.4 \cdot 0.6^{2} = 0.4 \cdot 0.36 = 0.144$$ 하측 누적확률 $$P(X \le 2) = 1 - 0.6^{3} = 1 - 0.216 = 0.784$$ 상측 누적확률 $$P(X \ge 2) = 0.6^{2} = 0.36$$ 평균 \(= 0.6/0.4 = 1.5\). 검산: \(0.784 + 0.36 - 0.144 = 1.000\).
자주 묻는 질문
x에 성공한 시행도 포함되나요? 아닙니다. 여기서 x는 첫 성공 전까지의 실패 횟수만 세므로 x는 0부터 시작합니다. 만약 첫 성공이 나온 시행 번호 k를 알고 있다면 \(x = k - 1\) 로 바꿔서 입력하세요.
p = 1이면 어떻게 되나요? 첫 시행에서 반드시 성공한다는 뜻입니다. 즉 \(f(0,1) = 1\) 이고, \(x \ge 1\) 에 대해서는 \(f(x,1) = 0\) 이며, 평균은 0입니다.
p = 0일 때 평균이 정의되지 않는 이유는? 어떤 시행에서도 성공하지 못한다면 기대되는 실패 횟수는 무한대가 됩니다. 따라서 \((1 - p)/p\) 공식이 0으로 나누는 형태가 되어 정의되지 않습니다.