Sai số chuẩn của tỷ lệ là gì?
Sai số chuẩn của tỷ lệ (SE) cho biết tỷ lệ tính từ một mẫu có thể dao động bao nhiêu so với tỷ lệ thực của toàn bộ tổng thể, do ảnh hưởng của việc lấy mẫu ngẫu nhiên. Nó phản ánh độ chính xác của một ước lượng, chẳng hạn tỷ lệ ủng hộ trong khảo sát, tỷ lệ chuyển đổi (conversion rate) hay tỷ lệ sản phẩm lỗi. Sai số chuẩn càng nhỏ thì tỷ lệ mẫu càng đáng tin cậy khi dùng để ước lượng giá trị của tổng thể.
Cách sử dụng công cụ
Nhập tỷ lệ mẫu p dưới dạng số thập phân từ 0 đến 1 (ví dụ 0,40 tương ứng với 40%) và cỡ mẫu n (tổng số quan sát). Công cụ sẽ trả về sai số chuẩn cùng với phương sai của mẫu. Bạn có thể dùng các giá trị này để xây dựng khoảng tin cậy hoặc thực hiện kiểm định giả thuyết về tỷ lệ.
Giải thích công thức
Sai số chuẩn của tỷ lệ được tính bằng:
$$SE = \sqrt{\dfrac{\text{p}\left(1 - \text{p}\right)}{\text{n}}}$$
Trong đó, \(p(1-p)\) là phương sai của một phép thử Bernoulli đơn lẻ. Chia cho \(n\) ta được phương sai của tỷ lệ mẫu, và lấy căn bậc hai sẽ đưa giá trị về cùng đơn vị với \(p\). Sai số chuẩn đạt mức lớn nhất khi \(p = 0{,}5\) (mức độ bất định cao nhất) và giảm dần khi cỡ mẫu \(n\) tăng lên.
Ví dụ minh họa
Giả sử trong 100 khách hàng được khảo sát có 40 người ưa thích một sản phẩm, vậy \(p = 0{,}40\) và \(n = 100\). Khi đó phương sai $$= 0{,}40 \times 0{,}60 / 100 = 0{,}0024,$$ và $$SE = \sqrt{0{,}0024} \approx 0{,}04899.$$ Khoảng tin cậy 95% gần đúng là \(0{,}40 \pm 1{,}96 \times 0{,}049\), tức khoảng từ 0,304 đến 0,496.
Câu hỏi thường gặp
p nên là số thập phân hay phần trăm? Hãy dùng số thập phân từ 0 đến 1. Để chuyển từ phần trăm, bạn chia cho 100 (ví dụ 25% = 0,25).
Khi nào công thức này áp dụng được? Công thức giả định mẫu lớn và được chọn ngẫu nhiên, cho kết quả chính xác nhất khi cả \(np\) và \(n(1-p)\) đều đạt khoảng từ 5 đến 10 trở lên.
Tỷ lệ nào cho sai số chuẩn lớn nhất? Với cùng một cỡ mẫu, \(p = 0{,}5\) tạo ra sai số chuẩn lớn nhất. Đây cũng là lý do giá trị này thường được dùng để tính cỡ mẫu một cách thận trọng.