포아송 분포 계산기란?
포아송 분포는 일정한 시간 또는 공간 구간 안에서 어떤 사건이 몇 번 일어나는지를 모델링합니다. 평균 발생률(평균값)이 일정하게 알려져 있고, 각 사건이 서로 독립적으로 발생한다는 가정을 전제로 합니다. 이 계산기는 여러 x 값에 대해 세 가지 값을 표로 정리해 줍니다. 바로 확률질량 \(f(x;\lambda)\), 하측 누적확률 \(P(x;\lambda) = P(X \le x)\), 상측 누적확률 \(Q(x;\lambda) = P(X \ge x)\)입니다.
사용 방법
먼저 강조해서 볼 계열을 선택하세요(확률질량 f, 하측 누적확률 P, 상측 누적확률 Q 중 하나). 이어서 평균값 \(\lambda\)(0 이상이어야 함), x의 초기값, 증가폭(스텝), 반복 횟수(행 수)를 입력합니다. 그러면 계산기가 \(x = \text{초기값},\ \text{초기값}+\text{스텝},\ \text{초기값}+2\cdot\text{스텝},\ \ldots\) 순으로 값을 생성하고, 각 x마다 f, P, Q를 보여주며 선택한 열을 강조 표시합니다.
공식 풀이
확률질량함수는 다음과 같습니다.
$$f(x;\lambda) = \frac{\lambda^{\,x}\,e^{-\lambda}}{x!}$$하측 누적분포는 x까지의 모든 확률질량을 더한 값으로 다음과 같습니다.
$$P(x;\lambda) = \sum_{t=0}^{x} \frac{\lambda^{\,t}\,e^{-\lambda}}{t!}$$상측 누적확률은 x 지점의 항 자체를 포함하므로 다음이 됩니다.
$$Q(x;\lambda) = 1 - P(x;\lambda) + f(x;\lambda)$$따라서 P와 Q는 \(f(x)\) 부분에서 서로 겹칩니다. 수치적 안정성을 위해 이 계산기는 로그 팩토리얼을 이용해 \(f = \exp(-\lambda + x\cdot\ln\lambda - \ln(x!))\) 로 f를 계산합니다.
계산 예시
\(\lambda = 5\), \(x = 0\)인 경우를 보겠습니다. \(e^{-5} = 0.006737947\) 이므로 \(f(0) = 0.006737947\), \(P(0) = 0.006737947\), \(Q(0) = 1 - 0.006737947 + 0.006737947 = 1\) 입니다. \(x = 5\)에서는 \(f(5) = 0.175467\), \(P(5) = 0.615961\), \(Q(5) = 0.559507\) 이 됩니다. 즉, 전체 확률질량의 약 61.6%가 \(X \le 5\) 구간에 모여 있다는 뜻입니다.
자주 묻는 질문
왜 P와 Q를 더하면 1을 넘나요? 하측 누적확률 \(P(X \le x)\)와 상측 누적확률 \(Q(X \ge x)\) 모두 x 지점의 점확률 \(f(x)\)를 포함하기 때문입니다. 그래서 둘의 합은 \(1 + f(x)\)가 됩니다.
\(\lambda = 0\)이면 어떻게 되나요? 모든 확률질량이 x = 0에 몰립니다. 즉 \(f(0) = 1\), \(x > 0\)인 경우 \(f(x) = 0\)이며, 0 이상의 모든 x에 대해 \(P(x) = 1\) 입니다.
\(\lambda\)가 정수가 아니어도 되나요? 됩니다. \(\lambda\)는 발생률이므로 0 이상의 어떤 값이든 가질 수 있습니다. 반면 x 값은 음수가 아닌 정수여야 합니다.