Công cụ này làm gì
Máy Tính Hồi Quy Bậc Hai Có Trọng Số giúp bạn khớp một đa thức bậc hai, \(y = A + Bx + Cx^{2}\), với tập điểm dữ liệu (x, y), trong đó mỗi điểm có thể đi kèm một tần số hoặc trọng số f. Đây chính là dạng bảng tần số của phương pháp bình phương tối thiểu bậc hai: một điểm xuất hiện f lần sẽ đóng góp f lần vào mọi tổng. Nếu bạn đặt mọi tần số bằng 1, phép tính trở về hồi quy bậc hai thông thường (không trọng số). Đây thuần túy là thống kê và áp dụng giống hệt nhau ở mọi quốc gia hay lĩnh vực.
Cách sử dụng
Nhập mỗi điểm dữ liệu trên một dòng theo dạng x, y, f. Tần số f là tùy chọn và mặc định bằng 1 khi để trống, nên 2, 5 nghĩa là x=2, y=5 với trọng số 1. Chọn số chữ số có nghĩa muốn hiển thị (mặc định là 10). Bạn cần ít nhất 3 giá trị x khác nhau để xác định duy nhất một đường parabol. Công cụ sẽ trả về các hệ số A, B, C cùng hệ số tương quan bội \(r\) của mô hình.
Giải thích công thức
Gọi \(n = \Sigma f\) là tổng trọng số. Tính các trung bình có trọng số \(\bar{x} = \Sigma xf / n\), \(\bar{y} = \Sigma yf / n\), và \(\overline{x^2} = \Sigma x^{2} f / n\). Lập các tổng đã quy tâm \(S_{xx}\), \(S_{xy}\), \(S_{xx^2}\), \(S_{x^2x^2}\), \(S_{x^2y}\), rồi giải hệ \(2\times 2\) tìm B và C với mẫu số \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^{2}\):
$$\hat{y} = A + Bx + Cx^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$Cuối cùng \(A = \bar{y} - B\cdot\bar{x} - C\cdot\overline{x^2}\). Hệ số tương quan là \(r = \sqrt{1 - \text{SSE}/\text{SST}}\), trong đó SSE là tổng bình phương phần dư có trọng số và SST là tổng bình phương toàn phần có trọng số.
Ví dụ minh họa
Dữ liệu với mọi f = 1: (1,2), (2,3), (3,6), (4,11), (5,18). Ở đây \(n=5\), \(\bar{x}=3\), \(\bar{y}=8\), \(\overline{x^2}=11\). Các tổng cho \(S_{xx}=10\), \(S_{xy}=40\), \(S_{xx^2}=60\), \(S_{x^2x^2}=374\), \(S_{x^2y}=254\), và \(\text{denom} = 10\cdot 374 - 60^{2} = 140\). Khi đó
$$B = \frac{40\cdot 374 - 60\cdot 254}{140} = -2,\quad C = \frac{10\cdot 254 - 60\cdot 40}{140} = 1,\quad A = 8 - (-2)(3) - 1\cdot 11 = 3.$$Mô hình \(y = 3 - 2x + x^{2}\) tái tạo chính xác mọi điểm, nên \(\text{SSE} = 0\) và \(r = 1\).
Câu hỏi thường gặp
Cột tần số có tác dụng gì? Đó là trọng số (số lần xuất hiện) của cặp (x, y) đó. Một dòng có f = 4 được tính như bốn quan sát giống nhau, rất tiện cho dữ liệu đã được nhóm hoặc lập bảng.
Tại sao cần 3 giá trị x khác nhau? Một parabol có ba tham số (A, B, C). Nếu có ít hơn ba giá trị x khác nhau, hệ phương trình trở nên suy biến và không xác định được mô hình; khi đó công cụ sẽ báo lỗi.
Diễn giải r như thế nào? \(r\) nằm trong khoảng từ 0 đến 1. Trên 0,7 cho thấy mô hình khớp mạnh, 0,4–0,7 là trung bình, 0,2–0,4 là yếu, và dưới 0,2 gần như không có tương quan.