Công cụ này làm gì?
Công cụ ước lượng khoảng mà một "giá trị thực" nhiều khả năng nằm trong đó, dựa trên trung bình mẫu (μ) và độ lệch chuẩn (σ). Nó giả định đại lượng tuân theo phân phối chuẩn và đưa ra khoảng hai phía đối xứng \(\mu \pm z\cdot\sigma\), trong đó z là giá trị tới hạn của phân phối chuẩn tắc ứng với mức tin cậy bạn chọn. Trung bình và độ lệch chuẩn là những con số thông thường, còn khoảng kết quả được trả về theo đúng đơn vị mà bạn nhập vào.
Cách sử dụng
Nhập giá trị trung bình, độ lệch chuẩn (phải bằng 0 hoặc lớn hơn) và mức tin cậy tính theo phần trăm, với điều kiện 50 < mức tin cậy < 100 (thường dùng là 95). Công cụ sẽ đổi phần trăm này thành xác suất p, tìm giá trị tới hạn \(z = \Phi^{-1}\!\left(\frac{1+p}{2}\right)\), rồi trả về cận dưới và cận trên. Ở mức 100%, khoảng sẽ kéo dài vô hạn, nên mức tin cậy luôn phải nhỏ hơn 100.
Giải thích công thức
Với xác suất p = mức tin cậy/100, giá trị z hai phía chính là phân vị của phân phối chuẩn tắc tại (1+p)/2. Với 95%, ta có \(\Phi^{-1}(0.975) \approx 1.95996\), nên khoảng là \(\mu \pm 1.96\sigma\). Một vài mốc dễ nhớ: mức bao phủ 68.26% tương ứng \(\mu \pm 1\sigma\), 95.45% tương ứng \(\mu \pm 2\sigma\), và 99.73% tương ứng \(\mu \pm 3\sigma\). Hàm phân phối chuẩn nghịch đảo được tính bằng phép xấp xỉ hữu tỉ (Acklam) kết hợp một bước tinh chỉnh Halley, nên không cần tra bảng.
$$\text{CI} = \text{Mean }\mu \pm z \cdot \text{SD }\sigma$$$$\text{where}\quad z = \Phi^{-1}\!\left(\frac{1 + \frac{\text{Confidence }\%}{100}}{2}\right)$$
Ví dụ minh họa
Với trung bình = 100, sd = 5 và mức tin cậy = 99%: p = 0.99, \(z = \Phi^{-1}(0.995) \approx 2.57583\). Cận dưới = \(100 - 2.57583\cdot 5 = 87.121\); cận trên = \(100 + 12.879 = 112.879\). Kết quả hiển thị là "nằm trong khoảng từ 87.12 đến 112.88".
Câu hỏi thường gặp
Tại sao mức 95% lại dùng 1.96 chứ không phải 1.645? Khoảng hai phía đối xứng chia phần còn lại 5% thành hai đuôi, mỗi đuôi 2.5%, nên ta lấy \(\Phi^{-1}(0.975) \approx 1.96\). Còn 1.645 là phân vị 95% một phía và không đúng khi cần một khoảng hai phía.
Tôi có nên dùng phân phối t thay thế không? Khi σ được ước lượng từ một mẫu nhỏ, phân phối t với cỡ mẫu n (khoảng là trung bình \(\pm\ t\cdot s/\sqrt{n}\)) sẽ phù hợp hơn. Công cụ này cố ý coi σ là giá trị đã biết của tổng thể và dùng z của phân phối chuẩn, nên không cần đến n.
Nếu sd = 0 thì sao? Khoảng thu lại thành một điểm duy nhất [trung bình, trung bình].