이 계산기의 기능
이 도구는 기하분포의 백분위수(분위수)를 구해 줍니다. 누적확률과 시행당 성공확률 p를 입력하면 그에 해당하는 값 x를 찾아냅니다. 여기서 기하분포는 첫 성공이 나오기 전까지의 실패 횟수를 세는 분포로, \(x = 0, 1, 2, 3, \ldots\) 의 값을 가집니다. 확률질량함수는 $$f(x, p) = p(1 - p)^{x}$$ 입니다.
두 가지 누적확률 정의
어느 쪽 꼬리(tail)를 기준으로도 계산할 수 있습니다. 하측 누적확률 \(P(x, p) = 1 - (1 - p)^{x+1}\) 은 실패가 x번 이하일 확률입니다. 상측 누적확률 \(Q(x, p) = (1 - p)^{x}\) 은 실패가 x번 이상일 확률입니다. 사용하려는 방식을 선택한 뒤 해당 확률값을 입력하면 됩니다.
공식 풀이
\(q = 1 - p\) 라고 합시다. 하측 누적분포함수(CDF)를 역으로 풀면, \(1 - q^{x+1} = P\) 에서 $$x = \frac{\ln(1 - P)}{\ln(q)} - 1$$ 이 됩니다. 상측 CDF를 역으로 풀면, \(q^{x} = Q\) 에서 $$x = \frac{\ln(Q)}{\ln(q)}$$ 가 됩니다. x는 실패 횟수이므로 반드시 정수여야 합니다. 따라서 백분위수 값은 \(\lceil x \rceil\)(올림)로 보고하며, 최소 0 이상이 되도록 제한합니다. 정밀한 계산을 위해 연속형 실숫값 해도 함께 표시합니다.
계산 예시
하측 방식, \(P = 0.8\), \(p = 0.4\) 인 경우를 봅시다. \(q = 0.6\), \(\ln(0.6) = -0.5108256\) 입니다. $$x = \frac{\ln(0.2)}{\ln(0.6)} - 1 = \frac{-1.6094379}{-0.5108256} - 1 = 3.151035 - 1 = 2.151035$$ 가 됩니다. 올림하면 정수 백분위수는 \(x = 3\) 입니다. 검산: \(P(3) = 1 - 0.6^{4} = 0.8704 \ge 0.8\) 이고, \(P(2) = 0.784 < 0.8\) 이므로 \(x = 3\) 이 맞습니다.
자주 묻는 질문
왜 올림(ceil)이 백분위수가 되나요? 정수 분위수는 누적확률이 목표값에 도달하는 가장 작은 x이므로, 연속형 해를 올림하여 구합니다.
p = 0 이거나 p = 1 이면 어떻게 되나요? \(p = 0\) 이면 성공이 절대 일어나지 않으므로 분위수는 정의되지 않거나 무한대입니다. \(p = 1\) 이면 모든 확률이 \(x = 0\) 에 집중되므로 분위수는 0 입니다.
P가 정확히 1이 될 수 있나요? 하측 방식에서는 어떤 유한한 x로도 \(P = 1\) 에 도달할 수 없으며(CDF는 1에 한없이 가까워질 뿐입니다), 따라서 이 입력값은 정의되지 않음으로 표시됩니다.