Phân phối chi-squared là gì?
Phân phối chi-squared (\(\chi^2\)) mô tả tổng bình phương của các biến ngẫu nhiên chuẩn tắc độc lập. Phân phối này chỉ phụ thuộc vào một tham số duy nhất là bậc tự do \(\nu\) (chữ Hy Lạp "nu"), và đóng vai trò nền tảng trong kiểm định giả thuyết, kiểm định mức độ phù hợp, phân tích bảng tương quan và ước lượng khoảng tin cậy cho phương sai. Công cụ này tính ba hàm liên quan theo \(x\) với một giá trị \(\nu\) cho trước: hàm mật độ xác suất \(f\), xác suất tích lũy dưới \(P(X \le x)\) và xác suất tích lũy trên \(Q(X > x)\).
Cách sử dụng
Trước tiên hãy chọn hàm mà bạn muốn hiển thị làm kết quả chính, sau đó nhập bậc tự do \(\nu\) (giá trị bất kỳ lớn hơn 0) và điểm \(x\) cần tính. Giá trị \(x\) ban đầu, bước nhảy và số điểm sẽ xác định một chuỗi \(x_k = \text{startX} + k\cdot\text{stepX}\), dùng để lập bảng hoặc vẽ đồ thị cho hàm đã chọn. Mọi dữ liệu nhập vào đều không có đơn vị nên bạn không cần phải chuyển đổi đơn vị.
Giải thích công thức
Hàm mật độ là $$f(\text{x};\,\nu) = \frac{\text{x}^{\,\frac{\nu}{2}-1}\,e^{-\frac{\text{x}}{2}}}{2^{\frac{\nu}{2}}\,\Gamma\!\left(\frac{\nu}{2}\right)}$$ với \(x \ge 0\). Các xác suất tích lũy sử dụng hàm gamma không đầy đủ đã được chuẩn hóa: $$F(\text{x};\,\nu) = P\!\left(\frac{\nu}{2},\,\frac{\text{x}}{2}\right) = \frac{\gamma\!\left(\frac{\nu}{2},\,\frac{\text{x}}{2}\right)}{\Gamma\!\left(\frac{\nu}{2}\right)}$$ bằng hàm gamma không đầy đủ dưới của \((\nu/2, x/2)\) chia cho \(\Gamma(\nu/2)\), và $$Q(\text{x};\,\nu) = 1 - P\!\left(\frac{\nu}{2},\,\frac{\text{x}}{2}\right) = \frac{\Gamma\!\left(\frac{\nu}{2},\,\frac{\text{x}}{2}\right)}{\Gamma\!\left(\frac{\nu}{2}\right)}.$$ Toàn bộ phép tính được thực hiện trong không gian logarit, áp dụng khai triển chuỗi hoặc phân số liên tục (thuật toán Lentz) cho hàm gamma không đầy đủ, vừa cho kết quả chính xác vừa tránh được tràn số.
Ví dụ minh họa
Với \(\nu = 3\) và \(x = 2\): \(a = \nu/2 = 1.5\) và \(z = x/2 = 1\). Xác suất tích lũy dưới \(P(2,3)\) xấp xỉ \(0.42759\), nên \(Q\) xấp xỉ \(0.57241\). Hàm mật độ cho kết quả $$f(2,3) = \frac{2^{0.5}\cdot e^{-1}}{2^{1.5}\cdot \Gamma(1.5)} \approx 0.20755.$$
Câu hỏi thường gặp
Vì sao \(f\) tiến tới vô cực tại \(x = 0\) khi \(\nu\) nhỏ? Khi \(\nu < 2\), hàm mật độ phân kỳ tới vô cực tại \(x = 0\); khi \(\nu = 2\) nó bằng \(0.5\); còn khi \(\nu > 2\) thì bằng 0 tại điểm này.
Làm sao để tìm giá trị tới hạn? Hãy đặt hàm là xác suất tích lũy dưới \(P\) rồi thử lần lượt các giá trị \(x\) cho đến khi \(P\) đạt mức mong muốn (ví dụ \(P = 0.95\) với \(\nu = 1\) cho \(x \approx 3.8415\)).
Xác suất tích lũy có chính xác không? Có - công cụ dùng hàm gamma không đầy đủ ở dạng đóng (closed-form) thay vì tích phân số, nên kết quả chính xác tới độ chính xác của máy tính.