Thống kê kiểm định chi bình phương là gì?
Thống kê kiểm định chi bình phương (χ²) đo lường mức độ chênh lệch giữa các tần số quan sát được và các tần số mà bạn kỳ vọng nhận được theo giả thuyết không. Đây là nền tảng của kiểm định độ phù hợp (goodness-of-fit) và kiểm định tính độc lập bằng chi bình phương. Giá trị χ² càng lớn thì sự khác biệt giữa số liệu thực tế quan sát và số liệu kỳ vọng càng nhiều, từ đó cung cấp bằng chứng để bác bỏ giả thuyết không.
Cách sử dụng máy tính
Bạn nhập các tần số quan sát dưới dạng danh sách phân cách bằng dấu phẩy, rồi nhập các tần số kỳ vọng tương ứng theo đúng thứ tự. Máy tính sẽ ghép từng giá trị quan sát với giá trị kỳ vọng tương ứng, tính phần đóng góp của mỗi nhóm rồi cộng lại để cho ra giá trị thống kê χ² tổng thể. Công cụ cũng hiển thị số nhóm (\(k\)) và bậc tự do (\(k - 1\)) để bạn tra giá trị tới hạn hoặc giá trị p trong bảng phân phối chi bình phương.
Giải thích công thức
Công thức tính là $$\chi^{2} = \sum_{i=1}^{k} \frac{\left(\text{O}_i - \text{E}_i\right)^{2}}{\text{E}_i}$$ Với mỗi nhóm, bạn lấy giá trị quan sát trừ đi giá trị kỳ vọng, bình phương kết quả để các chênh lệch dương và âm không triệt tiêu lẫn nhau, sau đó chia cho giá trị kỳ vọng để chuẩn hóa độ lệch. Cộng tất cả các phần đóng góp của mỗi nhóm lại ta được thống kê kiểm định. Mỗi tần số kỳ vọng phải lớn hơn 0; những nhóm có giá trị kỳ vọng bằng 0 sẽ được bỏ qua nhằm tránh phép chia cho 0.
Ví dụ minh họa
Giả sử một con xúc xắc được gieo 100 lần với số lần quan sát lần lượt là 30, 20, 25, 25 và số lần kỳ vọng đều bằng nhau là 25 cho mỗi mặt. Phần đóng góp của từng nhóm là \((30-25)^{2}/25 = 1\), \((20-25)^{2}/25 = 1\), \((25-25)^{2}/25 = 0\), và \((25-25)^{2}/25 = 0\). Cộng lại ta được $$\chi^{2} = 2{,}0$$ với 4 nhóm và 3 bậc tự do.
Câu hỏi thường gặp
Giá trị χ² cao có ý nghĩa gì? Nó cho thấy sự khác biệt lớn giữa dữ liệu quan sát và dữ liệu kỳ vọng, gợi ý rằng giả thuyết không có thể sai.
Làm thế nào để có giá trị p? Hãy so sánh giá trị thống kê χ² với phân phối chi bình phương dựa trên bậc tự do được hiển thị, thông qua bảng tra cứu hoặc phần mềm thống kê.
Hai danh sách có cần cùng độ dài không? Có — mỗi giá trị quan sát phải có một giá trị kỳ vọng tương ứng. Máy tính sẽ ghép cặp chúng theo thứ tự.