Hiệp phương sai là gì?
Hiệp phương sai (covariance) đo lường mức độ hai biến thay đổi cùng nhau. Khi hai biến có xu hướng cùng tăng, hiệp phương sai mang giá trị dương. Khi một biến tăng còn biến kia giảm, hiệp phương sai mang giá trị âm. Một giá trị gần bằng 0 cho thấy hai biến gần như không có mối quan hệ tuyến tính nào. Khác với hệ số tương quan, hiệp phương sai không được chuẩn hóa, nên độ lớn của nó phụ thuộc vào đơn vị của dữ liệu — nhưng dấu của nó vẫn cho bạn biết chiều hướng của mối quan hệ.
Công cụ này tính hiệp phương sai mẫu, tức là chia cho (n − 1) thay vì chia cho n. Việc điều chỉnh bằng (n − 1) được gọi là hiệu chỉnh Bessel, giúp đưa ra ước lượng không chệch khi dữ liệu của bạn là một mẫu được lấy ra từ một tổng thể lớn hơn.
Cách sử dụng máy tính
- Nhập các giá trị X dưới dạng dãy số cách nhau bằng dấu phẩy (ví dụ: 2, 4, 6, 8).
- Nhập các giá trị Y thành một dãy có cùng số lượng phần tử (ví dụ: 1, 3, 2, 5).
- Nhấn nút tính để xem kết quả hiệp phương sai mẫu.
Hai dãy phải có cùng số lượng giá trị, vì mỗi giá trị X được ghép cặp với một giá trị Y tương ứng. Hãy đảm bảo không có ô trống hay dấu phẩy dư thừa.
Công thức hiệp phương sai mẫu
Công thức được sử dụng là:
$$\text{cov}(X, Y) = \frac{\displaystyle\sum_{i=1}^{n}\left(x_i - \bar{x}\right)\left(y_i - \bar{y}\right)}{n - 1}$$Trong đó, \(\bar{x}\) và \(\bar{y}\) lần lượt là giá trị trung bình của X và Y, \(n\) là số cặp dữ liệu, và phép tổng cộng dồn tích các độ lệch của mỗi điểm so với giá trị trung bình của chính nó.
Ví dụ minh họa
Giả sử X = 2, 4, 6, 8 và Y = 1, 3, 2, 5.
- Trung bình của X = 5; Trung bình của Y = 2,75.
- Tích các độ lệch: \((-3)(-1{,}75) + (-1)(0{,}25) + (1)(-0{,}75) + (3)(2{,}25) = 5{,}25 - 0{,}25 - 0{,}75 + 6{,}75 = 11\).
- Chia cho \((n - 1) = 3\): hiệp phương sai \(= 11 / 3 \approx 3{,}67\).
Kết quả dương khẳng định rằng X và Y có xu hướng cùng tăng với nhau.
Câu hỏi thường gặp
Hiệp phương sai mẫu và hiệp phương sai tổng thể khác nhau thế nào? Hiệp phương sai mẫu chia cho (n − 1) và được dùng khi dữ liệu của bạn chỉ là một mẫu. Hiệp phương sai tổng thể chia cho n và được dùng khi bạn có dữ liệu của toàn bộ tổng thể.
Hiệp phương sai có thể lớn hơn 1 không? Có. Hiệp phương sai không bị giới hạn trong khoảng từ −1 đến 1 — khoảng đó chỉ áp dụng cho hệ số tương quan. Hiệp phương sai có thể nhận bất kỳ giá trị nào tùy theo thang đo của dữ liệu.
Hiệp phương sai liên hệ với hệ số tương quan ra sao? Hệ số tương quan bằng hiệp phương sai chia cho tích của hai độ lệch chuẩn, tạo ra một giá trị đã được chuẩn hóa nằm trong khoảng từ −1 đến 1.