Sai số biên cho tỷ lệ là gì?
Sai số biên (MOE - margin of error) cho biết tỷ lệ tính từ mẫu khảo sát có khả năng chênh lệch bao nhiêu so với tỷ lệ thực của toàn bộ tổng thể. Khi bạn khảo sát một mẫu và thấy có một phần \(\hat{p}\) số người được hỏi ủng hộ một điều gì đó, MOE chính là khoảng ± xung quanh con số ước lượng đó ở một mức tin cậy mà bạn chọn. Công cụ này mang tính phổ quát — áp dụng được cho bất kỳ cuộc khảo sát hay thăm dò ý kiến nào, ở bất kỳ quốc gia nào.
Cách sử dụng
Nhập tỷ lệ mẫu \(\hat{p}\) dưới dạng số thập phân từ 0 đến 1 (ví dụ 0,52 nghĩa là 52%), nhập cỡ mẫu \(n\), rồi chọn mức tin cậy (90%, 95% hoặc 99%). Công cụ sẽ trả về sai số biên dưới dạng phần trăm, sai số chuẩn, giá trị tới hạn \(z\) được dùng, cùng khoảng tin cậy thu được. Ngoài ra, công cụ còn kiểm tra "quy tắc năm lần" để bạn biết liệu phép xấp xỉ chuẩn (normal approximation) có hợp lệ hay không.
Giải thích công thức
Sai số biên được tính theo công thức
$$\text{MOE} = z \cdot \sqrt{\dfrac{\hat{p}\,\left(1 - \hat{p}\right)}{n}}$$Phần \(\sqrt{\dfrac{\hat{p}\,(1-\hat{p})}{n}}\) chính là sai số chuẩn của tỷ lệ — giá trị này càng nhỏ khi cỡ mẫu \(n\) càng lớn. Giá trị \(z\) là giá trị tới hạn của phân phối chuẩn tắc: 1,645 cho mức 90%, 1,96 cho mức 95% và 2,576 cho mức 99%. Nhân sai số chuẩn với \(z\) sẽ điều chỉnh độ rộng của khoảng theo mức độ chắc chắn mong muốn.
Ví dụ minh họa
Giả sử 52% trong số 1.000 cử tri được khảo sát ủng hộ một dự luật, vậy \(\hat{p} = 0{,}52\) và \(n = 1000\), ở mức tin cậy 95% (\(z = 1{,}96\)). Sai số chuẩn là
$$\sqrt{\dfrac{0{,}52 \cdot 0{,}48}{1000}} = \sqrt{0{,}0002496} \approx 0{,}0158$$Sai số biên là
$$1{,}96 \times 0{,}0158 \approx 0{,}0310$$tức khoảng 3,1%. Khoảng tin cậy là 52% ± 3,1%, tức xấp xỉ từ 48,9% đến 55,1%.
Câu hỏi thường gặp
Quy tắc "năm lần" là gì? Quy tắc này phát biểu rằng phép xấp xỉ chuẩn cho tỷ lệ chỉ đáng tin cậy khi cả \(n\cdot\hat{p} \geq 5\) và \(n\cdot(1-\hat{p}) \geq 5\). Nếu một trong hai giá trị nhỏ hơn 5, bạn nên dùng phương pháp chính xác như khoảng tin cậy Clopper–Pearson thay thế.
Vì sao dùng \(\hat{p} = 0{,}5\) khi chưa biết tỷ lệ? Tích \(\hat{p}(1-\hat{p})\) đạt giá trị lớn nhất tại 0,5, cho ra sai số biên thận trọng nhất (rộng nhất). Cách làm này rất phổ biến khi cần ước tính cỡ mẫu trước khi khảo sát.
Mẫu lớn hơn có làm giảm sai số biên không? Có — vì \(n\) nằm ở mẫu số dưới dấu căn, nên MOE giảm tỷ lệ thuận với \(1/\sqrt{n}\).