Kiểm định z hai tỷ lệ là gì?
Kiểm định z hai tỷ lệ giúp kiểm tra xem chênh lệch giữa hai tỷ lệ mẫu có ý nghĩa thống kê hay không. Đây là công cụ quen thuộc trong các thử nghiệm A/B, khi bạn cần so sánh tỷ lệ chuyển đổi, tỷ lệ phản hồi, tỷ lệ lỗi hay tỷ lệ thành công giữa hai nhóm độc lập. Theo giả thuyết không (H0), hai tỷ lệ tổng thể bằng nhau, vì vậy phép kiểm định sẽ gộp cả hai mẫu lại thành một ước lượng chung cho tỷ lệ này.
Cách sử dụng máy tính
Hãy nhập số lượng "thành công" (ví dụ: số lượt chuyển đổi, số phản hồi tích cực) và tổng cỡ mẫu cho từng nhóm trong hai nhóm. Máy tính sẽ trả về giá trị z, p-value hai phía, tỷ lệ của từng mẫu, tỷ lệ gộp và sai số chuẩn. Bạn so sánh p-value với mức ý nghĩa của mình (thường là 0,05): nếu p-value nhỏ hơn, chênh lệch giữa hai nhóm có ý nghĩa thống kê.
Giải thích công thức
Trước tiên, tính tỷ lệ của từng mẫu: \(\hat{p}_1 = x_1/n_1\) và \(\hat{p}_2 = x_2/n_2\). Theo giả thuyết không, tỷ lệ gộp là \(\hat{p} = (x_1 + x_2)/(n_1 + n_2)\). Sai số chuẩn của chênh lệch là $$SE = \sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}.$$ Cuối cùng, $$z = \frac{\hat{p}_1 - \hat{p}_2}{SE}.$$ P-value hai phía là \(2 \times P(Z > |z|)\) lấy từ phân phối chuẩn tắc.
Ví dụ minh họa
Giả sử Nhóm 1 có 45 lần thành công trên 100 (\(\hat{p}_1 = 0{,}45\)) và Nhóm 2 có 30 trên 100 (\(\hat{p}_2 = 0{,}30\)). Tỷ lệ gộp là \((45+30)/(100+100) = 0{,}375\). $$SE = \sqrt{0{,}375 \times 0{,}625 \times (0{,}01 + 0{,}01)} = \sqrt{0{,}0046875} \approx 0{,}06847.$$ Khi đó $$z = \frac{0{,}45 - 0{,}30}{0{,}06847} \approx 2{,}191,$$ cho p-value hai phía \(\approx 0{,}0285\) — có ý nghĩa ở mức 5%.
Câu hỏi thường gặp
Khi nào nên dùng kiểm định gộp hay không gộp? Phiên bản gộp (được dùng ở đây) giả định hai tỷ lệ bằng nhau theo giả thuyết không và là cách làm chuẩn khi kiểm định giả thuyết. Sai số chuẩn không gộp thường được dùng cho khoảng tin cậy.
Cần cỡ mẫu bao nhiêu? Phép xấp xỉ chuẩn cho kết quả tốt khi mỗi nhóm có ít nhất khoảng 5–10 số lần thành công và thất bại kỳ vọng.
P-value là một phía hay hai phía? Máy tính này báo cáo p-value hai phía, tức là kiểm tra xem hai tỷ lệ có khác nhau theo bất kỳ hướng nào hay không.