F분포 백분위수란?
F분포의 백분위수(역 F, 분위수, 임계값이라고도 합니다)는 분자 자유도 d1과 분모 자유도 d2를 갖는 F분포의 누적확률이 지정한 값과 같아지는 지점 x를 말합니다. 즉 F분포 누적분포함수(CDF)의 역함수이며, ANOVA(분산분석)나 회귀모형의 전체 유의성 검정, 분산비(등분산) 검정에서 F분포표를 찾을 때 사용하는 바로 그 임계값입니다.
계산기 사용법
먼저 누적 방식을 선택합니다. 확률이 \(P = \Pr(F \le x)\) 형태라면 하측 누적확률 P를 고르세요. 예를 들어 \(P = 0.95\)는 분포의 95%가 그 아래에 놓이는 지점을 돌려줍니다. 반대로 꼬리 확률 \(Q = \Pr(F > x)\)를 가지고 있다면 상측 누적확률 Q를 선택합니다. 예를 들어 \(Q = 0.05\)는 흔히 쓰는 상측 5% 임계값을 줍니다. 확률(0과 1 사이의 값), 분자 자유도 d1, 분모 자유도 d2를 입력한 뒤 계산을 실행하세요.
공식 설명
F분포의 CDF는 정칙화 불완전 베타함수 I로 표현됩니다. \(a = d_1/2\), \(b = d_2/2\)로 두고 \(w = d_1 x / (d_1 x + d_2)\)로 치환하면 다음과 같습니다.
$$F\text{-CDF}(x) = I_w(a, b)$$이를 역으로 풀기 위해 계산기는 (0, 1) 구간에서 이분법으로 \(I_w(a, b) = \text{목표확률}\)을 만족하는 \(w\)를 찾습니다. 이때 \(I_w\)는 Lanczos 근사를 이용한 로그감마와 Numerical Recipes의 연분수 전개로 계산합니다. 그런 다음 다음 식으로 되돌려 \(x\)를 구합니다.
$$x = \frac{d_2 w}{d_1 (1 - w)}$$상측 방식에서는 목표확률이 \(1 - Q\)가 됩니다.
계산 예시
\(P = 0.95\), \(d_1 = 5\), \(d_2 = 10\)인 경우 상측 5% F 임계값을 구한다고 합시다. \(a = 2.5\), \(b = 5\)로 두고 \(I_w(2.5, 5) = 0.95\)를 역으로 풀면 \(w \approx 0.6245\)가 나오며,
$$x = \frac{10 \times 0.6245}{5 \times 0.3755} \approx 3.3258$$이는 F분포표의 \(F_{0.05}(5, 10) = 3.3258\)과 정확히 일치합니다.
자주 묻는 질문
P와 Q는 어떻게 다른가요? P는 x까지의 하측(누적) 확률이고, Q는 x를 넘어서는 상측 꼬리 확률입니다. 두 값은 \(P = 1 - Q\)의 관계를 갖습니다.
확률은 왜 반드시 0과 1 사이여야 하나요? 확률 0은 분위수 x = 0에, 확률 1은 x → 무한대에 대응하기 때문입니다. 둘 다 유한하고 의미 있는 임계값이 아니므로 경계값은 사용할 수 없습니다.
자유도가 정수가 아니어도 되나요? 됩니다. 수식은 양의 실수 d1, d2 모두에 대해 성립합니다. 다만 ANOVA에서는 보통 정수 자유도를 사용합니다.