Sai số lấy mẫu là gì?
Sai số lấy mẫu là khoảng chênh lệch giữa một thống kê mẫu (chẳng hạn trung bình mẫu) và giá trị thực của tổng thể, phát sinh đơn giản vì bạn chỉ khảo sát một phần thay vì toàn bộ tổng thể. Công cụ này thể hiện mức độ bất định đó dưới dạng biên độ sai số theo công thức \(E = z \times s / \sqrt{n}\), trong đó z là điểm Z tương ứng với mức tin cậy, s là độ lệch chuẩn và n là cỡ mẫu.
Cách sử dụng
Hãy chọn mức tin cậy (90%, 95% hoặc 99%) — giá trị này sẽ quyết định điểm Z. Nhập độ lệch chuẩn của dữ liệu và số quan sát trong mẫu của bạn. Công cụ sẽ trả về sai số chuẩn (\(s/\sqrt{n}\)) cùng biên độ sai số đầy đủ (\(z \times s/\sqrt{n}\)). Cỡ mẫu càng lớn thì sai số càng nhỏ; ngược lại, độ biến thiên càng cao (s lớn hơn) thì sai số càng tăng.
Giải thích công thức
Trước tiên, sai số chuẩn của trung bình là $$SE = s / \sqrt{n}$$ — đại lượng này cho biết các giá trị trung bình mẫu thường dao động bao nhiêu quanh trung bình thực. Nhân với điểm Z sẽ quy đổi giá trị này thành nửa độ rộng của khoảng tin cậy. Các điểm Z thường gặp là 1,645 (90%), 1,96 (95%) và 2,576 (99%).
Ví dụ minh họa
Giả sử \(s = 15\), \(n = 100\), ở mức tin cậy 95% (\(z = 1{,}96\)). Sai số chuẩn là $$15 / \sqrt{100} = 15 / 10 = 1{,}5$$ Sai số lấy mẫu sẽ là $$1{,}96 \times 1{,}5 = 2{,}94$$ Như vậy, ước lượng đạt độ chính xác trong khoảng ±2,94 ở mức tin cậy 95%.
Câu hỏi thường gặp
Làm thế nào để giảm sai số lấy mẫu? Hãy tăng cỡ mẫu n — vì có căn bậc hai trong công thức nên khi tăng n lên gấp 4 lần, sai số sẽ giảm đi một nửa.
Nên dùng điểm Z nào? Hãy dùng 1,96 cho mức tin cậy chuẩn 95%; chọn 90% hoặc 99% nếu bài toán của bạn yêu cầu mức tin cậy khác.
Sai số lấy mẫu có giống với độ chệch (bias) không? Không. Sai số lấy mẫu mang tính ngẫu nhiên và giảm dần khi cỡ mẫu tăng; còn độ chệch là sai số hệ thống và không thể khắc phục bằng cách tăng cỡ mẫu.