Kiểm định Z một tỷ lệ là gì?
Kiểm định z một tỷ lệ (còn gọi là kiểm định tỷ lệ một mẫu) dùng để kiểm tra xem một tỷ lệ trong tổng thể có khác biệt so với một giá trị đã biết hoặc được giả định hay không. Phương pháp này rất phổ biến với dữ liệu dạng có/không, đạt/không đạt hay thành công/thất bại — chẳng hạn kiểm tra xem một đồng xu có cân bằng không, tỷ lệ chuyển đổi có vượt mức chuẩn không, hay tỷ lệ lỗi sản phẩm có đạt mục tiêu đề ra không.
Cách sử dụng máy tính này
Bạn hãy nhập số lần thành công (\(x\)), tổng cỡ mẫu (\(n\)) và tỷ lệ giả thuyết (\(p_0\), một giá trị nằm trong khoảng từ 0 đến 1). Sau đó chọn giả thuyết đối: hai phía (tỷ lệ thực chỉ khác \(p_0\)), phía trái (nhỏ hơn \(p_0\)) hoặc phía phải (lớn hơn \(p_0\)). Máy tính sẽ trả về tỷ lệ mẫu, sai số chuẩn, thống kê z và giá trị p tương ứng.
Giải thích công thức
Thống kê kiểm định là
$$z = \dfrac{\hat{p} - \text{p}_0}{\sqrt{\dfrac{\text{p}_0\left(1 - \text{p}_0\right)}{\text{n}}}} \qquad \hat{p} = \dfrac{\text{x}}{\text{n}}$$trong đó \(\hat{p} = x/n\) là tỷ lệ mẫu. Mẫu số chính là sai số chuẩn của tỷ lệ được tính dưới giả thuyết không (H₀), đó là lý do công thức dùng \(p_0\) thay vì \(\hat{p}\). Giá trị z thu được sẽ được so sánh với phân phối chuẩn tắc để suy ra giá trị p. Phép xấp xỉ chuẩn đáng tin cậy khi cả \(n\cdot p_0\) và \(n\cdot(1 - p_0)\) đều đạt ít nhất khoảng 5–10.
Ví dụ minh họa
Giả sử có 55 trên 100 cử tri ủng hộ một biện pháp và bạn kiểm định \(p_0 = 0{,}5\) với giả thuyết đối hai phía. Khi đó \(\hat{p} = 0{,}55\), sai số chuẩn \(= \sqrt{0{,}5\cdot 0{,}5/100} = 0{,}05\) và
$$z = \dfrac{0{,}55 - 0{,}5}{0{,}05} = 1{,}0$$Giá trị p hai phía \(\approx 0{,}317\), nên ở mức ý nghĩa \(\alpha = 0{,}05\) bạn sẽ không bác bỏ giả thuyết không.
Câu hỏi thường gặp
Cỡ mẫu bao nhiêu là phù hợp? Hãy đảm bảo \(n\cdot p_0 \geq 5\) và \(n\cdot(1 - p_0) \geq 5\) để phép xấp xỉ chuẩn còn đúng; nếu không, bạn nên dùng kiểm định nhị thức chính xác (exact binomial test).
Nên dùng một phía hay hai phía? Hãy dùng kiểm định hai phía, trừ khi bạn đã có giả thuyết về chiều hướng được xác định trước khi thu thập dữ liệu.
Diễn giải giá trị p như thế nào? Nếu giá trị p nhỏ hơn mức ý nghĩa của bạn (thường là 0,05), bạn bác bỏ giả thuyết không cho rằng tỷ lệ thực bằng \(p_0\).