Công cụ này làm gì
Công cụ này khớp một đường cong hồi quy với bảng phân phối tần suất gồm các điểm dữ liệu. Mỗi dòng là một bộ ba (x, y, f), trong đó x là giá trị độc lập, y là giá trị phụ thuộc và f là tần suất (trọng số) cho biết cặp giá trị đó xuất hiện bao nhiêu lần. Bạn chọn một trong bảy dạng đường cong, công cụ sẽ thực hiện khớp bình phương tối thiểu có trọng số tần suất, rồi trả về các hệ số, hệ số tương quan và một giá trị ước lượng. Đây hoàn toàn là toán học thuần túy nên áp dụng được ở mọi nơi.
Bảy mô hình
Tuyến tính: \(y = A + Bx\). Logarit: \(y = A + B\ln x\). Mũ cơ số e: \(y = A\,e^{Bx}\). Mũ dạng ab: \(y = A\,B^{x}\). Lũy thừa: \(y = A\,x^{B}\). Nghịch đảo: \(y = A + \dfrac{B}{x}\). Bậc hai: \(y = A + Bx + Cx^{2}\). Mọi mô hình không phải bậc hai đều được tuyến tính hóa thành \(Y = a + bX\) bằng một phép biến đổi phù hợp (logarit hoặc nghịch đảo) trước khi khớp, sau đó kết quả được biến đổi ngược lại thành \(A\) và \(B\). Riêng mô hình bậc hai được giải trực tiếp từ hệ phương trình chuẩn có trọng số.
Cách sử dụng
Nhập dữ liệu của bạn, mỗi dòng một bộ giá trị theo định dạng x, y, f. Chọn dạng hồi quy. Quyết định bạn muốn ước lượng y từ một giá trị x cho trước, hay ước lượng x từ một giá trị y cho trước, rồi nhập giá trị đã biết. Chọn số chữ số có nghĩa muốn hiển thị. Những dòng có tần suất bằng 0 hoặc để trống sẽ bị bỏ qua, còn các mô hình yêu cầu x hoặc y dương (logarit, mũ, lũy thừa) thì cần giá trị hợp lệ.
Ví dụ minh họa
Dữ liệu (x, y, f): (1,2,3), (2,4,5), (3,5,2), (4,8,4), (5,9,1). Với mô hình Tuyến tính, các tổng có trọng số cho ta \(N=15\), \(S_x=40\), \(S_y=77\), \(S_{xx}=130\), \(S_{xy}=249\). Mẫu số là $$15 \times 130 - 40^{2} = 350,$$ do đó $$B = \frac{15 \times 249 - 40 \times 77}{350} = \frac{655}{350} = 1{,}8714$$ và $$A = \frac{77 - 1{,}8714 \times 40}{15} = 0{,}1429.$$ Hệ số tương quan \(r\) khoảng \(0{,}9879\) (rất mạnh). Ước lượng y tại \(x=4\) cho $$0{,}1429 + 1{,}8714 \times 4 = 7{,}6286.$$
Câu hỏi thường gặp
Tần suất có tác dụng gì? Nó tạo trọng số cho mỗi quan sát, nên một cặp có \(f=5\) ảnh hưởng đến kết quả khớp gấp năm lần một cặp có \(f=1\).
Vì sao C bằng 0? Hệ số \(C\) chỉ tồn tại trong mô hình Bậc hai; với sáu mô hình còn lại, nó luôn bằng 0.
r đo điều gì với các mô hình đã biến đổi? Đó là hệ số tương quan Pearson của các biến đã tuyến tính hóa \((X, Y)\), nên \(|r|=1\) nghĩa là khớp hoàn hảo với dạng đã tuyến tính hóa, chứ không phải với đường cong gốc.