Điểm phần trăm của phân phối F là gì?
Điểm phần trăm của phân phối F (còn gọi là F nghịch đảo, phân vị hay giá trị tới hạn) là giá trị x sao cho hàm phân phối tích lũy F với bậc tự do d1 (tử số) và d2 (mẫu số) bằng một xác suất cho trước. Đây chính là hàm ngược của CDF phân phối F, và đúng bằng giá trị tới hạn mà bạn tra trong bảng F khi làm phân tích phương sai (ANOVA), kiểm định ý nghĩa tổng thể của mô hình hồi quy và kiểm định tỉ số phương sai (so sánh hai phương sai).
Cách sử dụng máy tính
Trước tiên hãy chọn kiểu tích lũy. Chọn Tích lũy đuôi trái P nếu xác suất của bạn là \(P = \Pr(F \le x)\) — ví dụ P = 0,95 trả về giá trị mà bên dưới nó chiếm 95% phân phối. Chọn Tích lũy đuôi phải Q nếu bạn có xác suất ở đuôi \(Q = \Pr(F > x)\) — ví dụ Q = 0,05 trả về giá trị tới hạn 5% phía trên thường gặp. Nhập xác suất (nằm hẳn trong khoảng từ 0 đến 1), bậc tự do tử số d1 và bậc tự do mẫu số d2, rồi bấm tính.
Giải thích công thức
CDF của phân phối F được viết qua hàm beta không đầy đủ chuẩn hóa I: đặt \(a = d_1/2\), \(b = d_2/2\) và thế biến \(w = \frac{d_1 x}{d_1 x + d_2}\), ta có \(\text{F-CDF}(x) = I_w(a, b)\). Để lấy nghịch đảo, máy tính giải phương trình $$F_p = \{\, x : I_{\frac{d_1 x}{d_1 x + d_2}}\!\left(\tfrac{d_1}{2},\tfrac{d_2}{2}\right) = \text{P} \,\}$$ theo w bằng phương pháp chia đôi trên khoảng (0, 1), tính \(I_w\) nhờ log-gamma Lanczos và phân số liên tục theo Numerical Recipes. Sau đó thế ngược lại \(x = \frac{d_2 w}{d_1 (1 - w)}\). Ở chế độ đuôi phải, xác suất mục tiêu trở thành \(P_{\text{mục tiêu}} = 1 - Q\).
Ví dụ minh họa
Với P = 0,95, d1 = 5, d2 = 10 ta tìm giá trị tới hạn F 5% phía trên. Đặt \(a = 2{,}5\) và \(b = 5\), giải nghịch đảo \(I_w(2{,}5;\ 5) = 0{,}95\) cho \(w \approx 0{,}6245\), và $$x = \frac{10 \times 0{,}6245}{5 \times 0{,}3755} \approx 3{,}3258$$ — đúng bằng giá trị tra bảng \(F_{0,05}(5;\ 10) = 3{,}3258\).
Câu hỏi thường gặp
P và Q khác nhau ra sao? P là xác suất tích lũy ở đuôi trái, tính đến điểm x; còn Q là xác suất ở đuôi phải, vượt quá x. Hai đại lượng liên hệ với nhau qua \(P = 1 - Q\).
Vì sao xác suất phải nằm hẳn trong khoảng 0 và 1? Xác suất bằng 0 ứng với phân vị x = 0, còn xác suất bằng 1 ứng với x → vô cực; cả hai đều không phải là giá trị tới hạn hữu hạn và có ý nghĩa.
Bậc tự do có thể không phải số nguyên không? Có — công thức vẫn đúng với mọi d1 và d2 dương bất kỳ, dù trong ANOVA người ta thường dùng số nguyên.