Phương sai tổng thể là gì?
Phương sai tổng thể (\(\sigma^2\)) cho biết mức độ phân tán của toàn bộ tập dữ liệu xung quanh giá trị trung bình. Khác với phương sai mẫu, công thức này chia tổng bình phương độ lệch cho N — tức tổng số giá trị — chứ không phải cho N−1. Bạn nên dùng phương sai tổng thể khi dữ liệu đại diện cho toàn bộ tổng thể, chứ không chỉ là một mẫu được lấy ra từ tổng thể đó.
Cách sử dụng máy tính
Hãy nhập các giá trị dữ liệu vào ô, ngăn cách nhau bằng dấu phẩy hoặc khoảng trắng (ví dụ: 4, 8, 6, 5, 3, 8). Máy tính sẽ tìm giá trị trung bình, lấy từng giá trị trừ đi trung bình, bình phương các độ lệch đó, cộng tất cả lại rồi chia cho số lượng giá trị. Bạn sẽ nhận được ngay phương sai, giá trị trung bình, tổng bình phương độ lệch và độ lệch chuẩn của tổng thể.
Giải thích công thức
Công thức phương sai tổng thể là
$$\sigma^2 = \frac{1}{n}\sum_{i=1}^{n}\left(x_i - \mu\right)^2$$Trong đó \(\mu\) là trung bình của tổng thể, \(x_i\) là từng giá trị riêng lẻ, \(n\) là số lượng giá trị, còn \(\Sigma\) nghĩa là "tổng của." Khoảng cách từ mỗi giá trị đến trung bình được bình phương lên để các độ lệch âm và dương không triệt tiêu lẫn nhau. Độ lệch chuẩn của tổng thể \(\sigma\) chính là căn bậc hai của phương sai.
Ví dụ minh họa
Xét bộ dữ liệu 4, 8, 6, 5, 3, 8. Trung bình là
$$\mu = \frac{4+8+6+5+3+8}{6} = \frac{34}{6} \approx 5{,}6667$$Bình phương các độ lệch:
$$\begin{aligned}(4-5{,}6667)^2 &= 2{,}7778 \\ (8-5{,}6667)^2 &= 5{,}4444 \\ (6-5{,}6667)^2 &= 0{,}1111 \\ (5-5{,}6667)^2 &= 0{,}4444 \\ (3-5{,}6667)^2 &= 7{,}1111 \\ (8-5{,}6667)^2 &= 5{,}4444\end{aligned}$$Tổng của chúng là \(21{,}3333\). Chia cho \(n=6\) ta được
$$\sigma^2 \approx 3{,}5556, \qquad \sigma \approx 1{,}8856$$Câu hỏi thường gặp
Phương sai tổng thể hay phương sai mẫu — nên dùng cái nào? Dùng phương sai tổng thể (\(\div N\)) khi dãy số của bạn là toàn bộ tổng thể. Dùng phương sai mẫu (\(\div N-1\)) khi đó chỉ là một mẫu dùng để ước lượng cho một tổng thể lớn hơn.
Phương sai có thể âm không? Không. Vì các độ lệch đều được bình phương nên phương sai luôn bằng 0 hoặc dương. Nó chỉ bằng 0 khi tất cả các giá trị đều giống hệt nhau.
Phương sai có đơn vị là gì? Phương sai mang đơn vị bình phương của dữ liệu. Để quay về đơn vị gốc, bạn lấy căn bậc hai để có độ lệch chuẩn.