Kiểm định Chi bình phương về tính độc lập là gì?
Kiểm định chi bình phương (χ²) về tính độc lập giúp xác định liệu hai biến phân loại có mối liên hệ với nhau hay không. Với bảng tần số chéo 2×2, phép kiểm định này so sánh các tần số bạn thực sự quan sát được với các tần số kỳ vọng nếu hai biến hoàn toàn độc lập. Khi mức chênh lệch càng lớn thì giá trị χ² càng cao, cho thấy hai biến nhiều khả năng có liên quan đến nhau.
Cách sử dụng công cụ
Nhập bốn giá trị tần số trong bảng 2×2 của bạn: A và B nằm ở hàng thứ nhất, C và D nằm ở hàng thứ hai. Công cụ sẽ cộng tổng từng hàng, tổng từng cột và tổng chung, tính tần số kỳ vọng cho mỗi ô, rồi cộng các bình phương độ lệch chuẩn hóa để ra giá trị χ². Bên cạnh đó, công cụ còn cho biết bậc tự do (luôn bằng 1 với bảng 2×2), giá trị p gần đúng, giá trị tới hạn tại mức 0,05 và kết luận liệu kết quả có ý nghĩa thống kê hay không.
Giải thích công thức
Với mỗi ô, tần số kỳ vọng được tính bằng \(E = (\text{tổng hàng} \times \text{tổng cột}) / \text{tổng chung}\). Thống kê kiểm định là $$\chi^2 = \sum \dfrac{(O - E)^2}{E}$$ lấy trên cả bốn ô. Với một bậc tự do, giá trị tới hạn tại mức ý nghĩa 5% là 3,841. Nếu χ² của bạn lớn hơn 3,841, bạn bác bỏ giả thuyết không (giả thuyết về tính độc lập).
Ví dụ minh họa
Giả sử A = 10, B = 20, C = 30, D = 40. Tổng hai hàng là 30 và 70; tổng hai cột là 40 và 60; tổng chung = 100. Các tần số kỳ vọng lần lượt là 12, 18, 28, 42. Khi đó $$\chi^2 = \frac{(10-12)^2}{12} + \frac{(20-18)^2}{18} + \frac{(30-28)^2}{28} + \frac{(40-42)^2}{42} \approx 0{,}3333 + 0{,}2222 + 0{,}1429 + 0{,}0952 \approx 0{,}7937$$ Vì 0,79 < 3,841, chúng ta không đủ cơ sở để bác bỏ giả thuyết về tính độc lập.
Câu hỏi thường gặp
Vì sao bậc tự do ở đây luôn bằng 1? Bậc tự do \(= (\text{số hàng} - 1)(\text{số cột} - 1) = (2-1)(2-1) = 1\).
Giá trị p nhỏ có ý nghĩa gì? Giá trị p nhỏ hơn 0,05 cho thấy mối liên hệ quan sát được khó có thể xảy ra một cách ngẫu nhiên nếu hai biến độc lập, nên hai biến nhiều khả năng có liên quan với nhau.
Giá trị p có chính xác tuyệt đối không? Công cụ sử dụng phép xấp xỉ số học tiêu chuẩn cho phân phối chi bình phương với 1 bậc tự do, đủ chính xác cho các quyết định thông thường nhưng không thể thay thế phần mềm thống kê chuyên dụng trong những trường hợp đặc biệt.