Công cụ này làm gì
Công cụ này khớp một đường cong xu hướng dạng mũ \(y = A\cdot e^{Bx}\) vào tập dữ liệu có trọng số theo tần suất. Mỗi dòng dữ liệu là một bộ ba (x, y, f), trong đó f là tần suất hay trọng số — tức số lần quan sát đó xuất hiện. Kết quả trả về gồm hai hệ số A và B đã khớp, cùng với hệ số tương quan r của phép hồi quy tuyến tính nền tảng. Đây thuần túy là toán học nên áp dụng giống hệt nhau ở mọi nơi, không phụ thuộc vào quy tắc của bất kỳ quốc gia nào.
Cách sử dụng
Nhập mỗi điểm trên một dòng theo dạng x, y, f. Giá trị y bắt buộc phải lớn hơn 0, bởi mô hình được tuyến tính hóa bằng cách lấy logarit tự nhiên. Nếu bạn bỏ trống cột thứ ba, tần suất sẽ mặc định bằng 1. Hãy chọn số chữ số có nghĩa muốn hiển thị, sau đó đọc kết quả A, B, r và phương trình đã khớp với các giá trị được thế vào.
Giải thích công thức
Vì \(\ln y = \ln A + B\cdot x\), nên việc khớp đường mũ quy về bài toán hồi quy tuyến tính có trọng số của \(\ln y\) theo \(x\). Dùng các tổng có trọng số trong đó mỗi số hạng được nhân với tần suất \(f\), ta định nghĩa \(n = \sum f\), các trung bình có trọng số \(\bar{x}\) và \(\bar{L}\) (trung bình của \(\ln y\)), cùng các tổng bình phương có trọng số \(S_{xx}\), \(S_{yy}\) và tích chéo \(S_{xy}\). Khi đó
$$y = A \cdot e^{Bx}$$với
$$\left\{ \begin{aligned} B &= \frac{S_{xy}}{S_{xx}} \\ A &= e^{\,\bar{L} - B\bar{x}} \\ S_{xx} &= \textstyle\sum f x^{2} - n\bar{x}^{2} \\ S_{xy} &= \textstyle\sum f x \ln y - n\bar{x}\bar{L} \\ n &= \textstyle\sum f,\quad \bar{x}=\tfrac{\sum f x}{n},\quad \bar{L}=\tfrac{\sum f \ln y}{n} \end{aligned} \right.$$và \(r = \dfrac{S_{xy}}{\sqrt{S_{xx}} \cdot \sqrt{S_{yy}}}\). Giá trị r càng gần \(\pm 1\) thì mức độ khớp càng tốt.
Ví dụ minh họa
Lấy các điểm (1, 2.7), (2, 7.4), (3, 20.1), (4, 54.6), mỗi điểm có tần suất 1, vốn nằm rất gần đường \(y = e^{x}\). Ở đây \(\bar{x} = 2.5\), \(\bar{L} \approx 2.49887\), \(S_{xx} = 5\), \(S_{xy} \approx 5.0098\), \(S_{yy} \approx 5.0196\). Suy ra \(B \approx 1.0020\),
$$A = e^{\,2.49887 - 2.5048} \approx 0.9940$$và \(r \approx 0.9998\). Phương trình khớp xấp xỉ là
$$y = 0.9940\cdot e^{1.0020\cdot x}$$— về cơ bản chính là \(y = e^{x}\).
Câu hỏi thường gặp
Vì sao y phải dương? Phép khớp sử dụng \(\ln(y)\); mà logarit của số 0 hay số âm không xác định, nên những dòng như vậy sẽ bị loại bỏ.
Tần suất f thể hiện điều gì? Nó cho biết mỗi điểm tác động mạnh đến mức nào lên kết quả khớp — rất hữu ích với các bảng phân bố tần suất, nơi nhiều quan sát cùng chia sẻ một cặp (x, y).
Đọc r như thế nào? \(|r|\) trên 0.7 là tương quan mạnh, 0.4–0.7 là trung bình, 0.2–0.4 là yếu, và dưới 0.2 thì gần như không có tương quan.