Công cụ này là gì
Công cụ này ước lượng số lượng người tham gia khảo sát tối thiểu mà bạn cần để ước lượng một tỷ lệ trong tổng thể với sai số cho phép và mức tin cậy đã chọn. Đây là công thức tiêu chuẩn được dùng trong nghiên cứu thị trường, thăm dò ý kiến và các khảo sát y khoa khi kết quả là một con số phần trăm (ví dụ: "bao nhiêu phần trăm người trả lời có").
Cách sử dụng
Hãy chọn mức tin cậy (90%, 95% hoặc 99%), nhập tỷ lệ kỳ vọng dưới dạng phần trăm, rồi nhập sai số cho phép mong muốn cũng dưới dạng phần trăm. Nếu bạn chưa có ước lượng trước về tỷ lệ, hãy dùng 50% — đây là giá trị thận trọng nhất và cho ra cỡ mẫu lớn nhất.
Giải thích công thức
Cỡ mẫu được tính bằng $$n = \left\lceil \frac{\text{z}^{2} \cdot \text{p}\,(1 - \text{p})}{\text{E}^{2}} \right\rceil$$ Trong đó \(z\) là giá trị tới hạn của phân phối chuẩn (1,645 cho 90%, 1,96 cho 95%, 2,576 cho 99%), \(p\) là tỷ lệ kỳ vọng dưới dạng số thập phân, còn \(E\) là sai số cho phép dưới dạng số thập phân. Vì cỡ mẫu phải là số nguyên nên kết quả được làm tròn lên.
Ví dụ minh họa
Với mức tin cậy 99% (z = 2,576), p = 30% (0,30) và E = 4% (0,04): $$n = \frac{2{,}576^{2} \times 0{,}30 \times 0{,}70}{0{,}04^{2}} = \frac{6{,}635776 \times 0{,}21}{0{,}0016} = \frac{1{,}39351296}{0{,}0016} \approx 870{,}95$$ Làm tròn lên, bạn cần 871 người tham gia.
Câu hỏi thường gặp
Tại sao nên dùng 50% khi tôi chưa biết tỷ lệ? Tích \(p(1-p)\) đạt giá trị lớn nhất tại \(p = 0{,}5\), nên giá trị này cho ra cỡ mẫu an toàn nhất (lớn nhất).
Công thức này có tính đến quy mô tổng thể không? Không — đây là công thức dành cho tổng thể vô hạn. Với các tổng thể nhỏ, bạn cần áp dụng hệ số hiệu chỉnh cho tổng thể hữu hạn (finite population correction).
Sai số cho phép là gì? Đó là khoảng ± xung quanh ước lượng của bạn tại mức tin cậy đã chọn.