비중심 F-분포란?
비중심 F-분포(noncentral F-distribution)는 일반적인 중심 F-분포에 비중심 모수 \(\lambda\)(람다)를 더해 확장한 분포입니다. 비중심 카이제곱 변량(자유도 \(\nu_1\)으로 나눈 값)과 그와 독립인 중심 카이제곱 변량(자유도 \(\nu_2\)로 나눈 값)의 비율이 따르는 분포로 정의됩니다. 이 분포는 통계적 검정력 분석의 핵심입니다. 귀무가설이 거짓일 때 분산분석(ANOVA)이나 회귀분석의 F-검정 통계량은 비중심 F-분포를 따르며, \(\lambda\)는 참 효과가 귀무가설에서 얼마나 떨어져 있는지를 나타냅니다. \(\lambda = 0\)이면 이 분포는 우리에게 익숙한 중심 F-분포로 되돌아갑니다.
계산기 사용법
먼저 무엇을 계산할지 고르세요. 확률밀도 \(f\), 하측 누적확률 \(P\)(CDF, \(x\) 왼쪽 면적), 상측 누적확률 \(Q = 1 - P\)(\(x\) 오른쪽 면적) 중에서 선택할 수 있습니다. 그다음 분자 자유도 \(\nu_1\), 분모 자유도 \(\nu_2\), 비중심 모수 \(\lambda\)를 입력합니다. 마지막으로 시작값, 증가폭(step), 반복 횟수를 지정해 일련의 \(x\) 값을 정의합니다. 그러면 계산기가 \(x = \text{시작값} + i \times \text{step}\) (\(i = 0 \sim \text{반복횟수}-1\))에서 선택한 함수를 계산해 표로 정리해 줍니다.
수식 풀이
밀도는 중심 F 밀도들을 푸아송 가중치로 평균한 값입니다. 각 가중치는 \(w_j = e^{-\lambda/2}(\lambda/2)^j / j!\) 로, 평균이 \(\lambda/2\)인 푸아송 분포에서 사건이 \(j\)번 일어날 확률에 해당합니다. \(j\)번째 항은 자유도 \((\nu_1 + 2j, \nu_2)\)를 갖는 중심 F 밀도이며, 베타 함수 \(B(a,b) = \Gamma(a)\Gamma(b)/\Gamma(a+b)\)를 사용해 표현됩니다.
$$f(x) = \sum_{j=0}^{\infty} \frac{e^{-\lambda/2}\left(\lambda/2\right)^{j}}{j!}\; \frac{\left(\tfrac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}+j} x^{\frac{\nu_1}{2}+j-1}}{B\!\left(\tfrac{\nu_1}{2}+j,\tfrac{\nu_2}{2}\right)\left(1+\tfrac{\nu_1}{\nu_2}x\right)^{\frac{\nu_1+\nu_2}{2}+j}}$$누적확률은 각 밀도를 대응하는 중심 F의 CDF로 바꾼 것으로, 이는 \(z = \nu_j x / (\nu_2 + \nu_j x)\)에서 평가한 정규화 불완전 베타 함수 \(I_z(\nu_j/2, \nu_2/2)\)와 같습니다.
$$F(x;\nu_1,\nu_2,\lambda) = \sum_{j=0}^{\infty} \frac{e^{-\lambda/2}\left(\lambda/2\right)^{j}}{j!}\; I_{z}\!\left(\tfrac{\nu_1}{2}+j,\; \tfrac{\nu_2}{2}\right),\quad z = \frac{\nu_1\,x}{\nu_1\,x + \nu_2}$$
계산 예시
\(\nu_1 = 3\), \(\nu_2 = 2\), \(\lambda = 0\)(중심인 경우)으로 두고 \(x = 1\)에서 \(P\)를 구해 봅시다. 그러면 \(z = 3\times 1/(2 + 3\times 1) = 0.6\) 이고 \(P = I_{0.6}(1.5, 1.0)\)입니다. \(I_z(a,1) = z^a\) 이므로 이는 \(0.6^{1.5} = 0.464758\), 즉 \(P \approx 0.4648\), \(Q \approx 0.5352\)가 됩니다. 여기에 비중심 모수 \(\lambda = 1\)을 더하면 질량이 더 큰 \(x\) 쪽으로 이동하면서 하측 확률이 약 \(P = 0.451\)로 낮아집니다.
자주 묻는 질문
\(\lambda = 0\)이면 어떻게 되나요? 결과는 정확히 중심 F-분포가 됩니다. \(j = 0\) 항만 가중치를 가지기 때문입니다.
왜 \(x = 0\)에서 밀도가 0인가요? \(\nu_1 \geq 2\)일 때는 \(x = 0\)에서 밀도가 0입니다. 반면 \(\nu_1 < 2\)일 때는 \(x\)가 0에 가까워질수록 무한대로 발산하므로, 그 지점의 \(x = 0\)에서의 값은 의미가 없습니다.
급수 계산은 얼마나 정확한가요? 푸아송 가중치는 누적 질량이 사실상 1에 도달할 때까지 합산되며, 불완전 베타 함수는 수치 안정성을 위해 로그 감마(log-gamma)와 연분수(continued fraction) 방식으로 계산합니다. 덕분에 일반적인 입력 범위에서 높은 정밀도를 보장합니다.