Công cụ này làm gì
Công cụ này khớp một đường thẳng \(y = A + Bx\) với một tập điểm dữ liệu bằng phương pháp bình phương tối thiểu, trong đó mỗi điểm có thể mang theo một tần số hoặc trọng số f. Việc gắn trọng số tần số giúp bạn tóm gọn các quan sát lặp lại một cách tinh gọn: thay vì phải liệt kê cùng một cặp (x, y) nhiều lần, bạn chỉ cần nhập một lần kèm theo số lần xuất hiện. Đây là công cụ thống kê toán học thuần túy, mang tính phổ quát và cho kết quả như nhau ở mọi nơi.
Cách sử dụng
Nhập mỗi dòng một điểm dữ liệu theo dạng x, y, f. Cột tần số là tùy chọn; nếu bạn bỏ trống, mọi điểm sẽ có trọng số bằng nhau (hồi quy thông thường, không trọng số). Chọn số chữ số có nghĩa muốn hiển thị cho kết quả, sau đó bấm tính. Công cụ sẽ trả về đường hồi quy, hệ số góc B và tung độ gốc A, hệ số tương quan Pearson r, tổng tần số n, trung bình của x và y, cùng các tổng bổ trợ Sxx, Syy và Sxy.
Giải thích công thức
Gọi các dòng dữ liệu là \(i = 1..N\) với các giá trị \(x_i\), \(y_i\) và tần số \(f_i\). Tổng tần số là \(n = \sum f_i\). Các giá trị trung bình có trọng số là \(\bar{x} = \sum x_i f_i / n\) và \(\bar{y} = \sum y_i f_i / n\). Các tổng bình phương là
$$S_{xx} = \sum x_i^2 f_i - n\cdot\bar{x}^2, \quad S_{yy} = \sum y_i^2 f_i - n\cdot\bar{y}^2, \quad S_{xy} = \sum x_i y_i f_i - n\cdot\bar{x}\cdot\bar{y}.$$Hệ số góc là \(B = S_{xy}/S_{xx}\), tung độ gốc là \(A = \bar{y} - B\cdot\bar{x}\), và hệ số tương quan là
$$r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}.$$
Ví dụ minh họa
Với các dòng dữ liệu (1,2,1), (2,3,2), (3,5,1), (4,4,2), (5,6,1), (6,7,1): \(n = 8\), \(\bar{x} = 3.375\), \(\bar{y} = 4.25\). Khi đó \(S_{xx} = 19.875\), \(S_{yy} = 19.5\), \(S_{xy} = 18.25\). Suy ra
$$B = 18.25/19.875 \approx 0.9182, \quad A = 4.25 - 0.9182\cdot 3.375 \approx 1.1509,$$và \(r \approx 0.9271\) — một mối tương quan dương mạnh. Đường hồi quy khớp được là
$$y = 1.1509 + 0.9182\cdot x.$$Câu hỏi thường gặp
Cột tần số dùng để làm gì? Nó gán trọng số cho mỗi điểm. Một điểm có \(f = 3\) được tính như thể bạn đã quan sát điểm đó ba lần. Trọng số là số thập phân (phân số) cũng được chấp nhận.
Khi nào không tính được r? Nếu tất cả các giá trị x đều bằng nhau (\(S_{xx} = 0\)) thì không xác định được hệ số góc, và nếu \(S_{xx}\) hoặc \(S_{yy}\) bằng 0 thì không xác định được hệ số tương quan vì không có sự biến thiên.
Đánh giá độ mạnh của tương quan như thế nào? Dựa vào \(|r|\): trên 0.7 là mạnh, từ 0.4 đến 0.7 là trung bình, từ 0.2 đến 0.4 là yếu, và dưới 0.2 thì gần như không có tương quan.