Phương sai mẫu là gì?
Phương sai mẫu (\(s^2\)) cho biết các giá trị trong một tập dữ liệu phân tán như thế nào xung quanh giá trị trung bình. Đó là trung bình của các bình phương khoảng cách từ mỗi điểm đến trung bình, nhưng mẫu số dùng n − 1 thay vì n. Việc chia cho n − 1 (gọi là hiệu chỉnh Bessel) giúp kết quả trở thành ước lượng không chệch của phương sai tổng thể thực sự khi bạn chỉ có một mẫu chứ không phải toàn bộ dữ liệu.
Cách sử dụng máy tính
Nhập các số của bạn, phân cách bằng dấu phẩy hoặc khoảng trắng — ví dụ 4, 8, 15, 16, 23, 42. Máy tính sẽ trả về phương sai mẫu, độ lệch chuẩn mẫu, giá trị trung bình, số lượng phần tử và tổng bình phương độ lệch, để bạn có thể kiểm tra lại từng bước.
Giải thích công thức
Trước tiên, tính giá trị trung bình \(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\). Sau đó, với mỗi giá trị, lấy giá trị đó trừ đi trung bình rồi bình phương hiệu số. Cộng tất cả các bình phương độ lệch này lại để được \(\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}\). Cuối cùng, chia cho n − 1 để có phương sai mẫu. Lấy căn bậc hai của kết quả sẽ cho độ lệch chuẩn mẫu \(s\).
$$s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}$$
Ví dụ minh họa
Với tập số 4, 8, 15, 16, 23, 42: tổng là 108 và \(n = 6\), nên trung bình là 18. Các bình phương độ lệch lần lượt là 196, 100, 9, 4, 25 và 576. Cộng lại ta được \(196 + 100 + 9 + 4 + 25 + 576 = 910\). Phương sai bằng \(910 / 5 = 182\). Hãy luôn xác nhận đúng giá trị trung bình trước khi thực hiện phép chia.
Câu hỏi thường gặp
Tại sao chia cho n − 1 mà không phải n? Chia cho n sẽ đánh giá thấp mức độ phân tán của tổng thể; chia cho n − 1 giúp khắc phục độ chệch này.
Khi nào nên dùng phương sai tổng thể thay vì phương sai mẫu? Chỉ dùng phương sai tổng thể (chia cho n) khi dữ liệu của bạn bao gồm toàn bộ các phần tử của tổng thể, chứ không phải chỉ là một mẫu.
Phương sai lớn hơn có ý nghĩa gì? Phương sai càng lớn nghĩa là các điểm dữ liệu càng phân tán rộng xung quanh giá trị trung bình.