Công cụ này làm gì
Công cụ này giúp bạn khớp một đường xu hướng hàm mũ ab dạng \(y = A\cdot B^{x}\) với một bảng phân phối tần số gồm các điểm dữ liệu. Mỗi dòng chứa một giá trị x, một giá trị y và một tần số \(f\) (số lần xuất hiện, hay trọng số, của cặp (x, y)). Đây là một phương pháp thống kê thuần túy và áp dụng giống hệt nhau ở mọi nơi — không phụ thuộc đơn vị hay quốc gia nào.
Cách sử dụng
Nhập mỗi điểm dữ liệu trên một dòng theo định dạng x, y, f. Giá trị y bắt buộc phải dương vì phương pháp này lấy logarit tự nhiên của y. Nếu bạn muốn một phép khớp thông thường không có trọng số, hãy đặt mọi tần số bằng 1 (bạn cũng có thể bỏ qua số thứ ba, khi đó mặc định f = 1). Chọn số chữ số có nghĩa cho các hệ số hiển thị, rồi đọc kết quả A, B và hệ số tương quan r.
Giải thích công thức
Mẹo ở đây là tuyến tính hóa mô hình: lấy logarit hai vế của \(y = A\cdot B^{x}\) ta được \(\ln y = \ln A + x\cdot\ln B\), tức là một đường thẳng trong không gian (x, ln y). Sau đó ta thực hiện hồi quy bình phương tối thiểu có trọng số tần số của ln y theo x. Với \(n = \sum f\), các giá trị trung bình có trọng số \(\bar{x}\) và \(\overline{\ln y}\), cùng các tổng có trọng số \(S_{xx}\), \(S_{yy}\), \(S_{xy}\), thì hệ số góc là \(S_{xy}/S_{xx}\) và hệ số chặn là \(\overline{\ln y} - \bar{x}\cdot\)hệ số góc. Lấy lũy thừa cơ số e cho ta \(B = e^{\text{hệ số góc}}\) và \(A = e^{\text{hệ số chặn}}\). Hệ số tương quan \(r = S_{xy} / (\sqrt{S_{xx}}\cdot\sqrt{S_{yy}})\) cho biết mô hình log-tuyến tính khớp tốt đến mức nào.
$$y = A \cdot B^{x}, \qquad B = e^{\,S_{xy}/S_{xx}}, \quad A = e^{\,\overline{\ln y} - \bar{x}\,(S_{xy}/S_{xx})}$$ $$\text{where}\quad \left\{ \begin{aligned} n &= \textstyle\sum f, \quad \bar{x} = \frac{\sum f x}{n}, \quad \overline{\ln y} = \frac{\sum f \ln y}{n} \\ S_{xx} &= \textstyle\sum f x^{2} - n\,\bar{x}^{2} \\ S_{xy} &= \textstyle\sum f\,x \ln y - n\,\bar{x}\,\overline{\ln y} \\ x,\,y,\,f &= \text{Data points (x, y, f)} \end{aligned} \right.$$
Ví dụ minh họa
Với dữ liệu tăng gấp đôi hoàn hảo (1, 2), (2, 4), (3, 8), (4, 16) đều có f = 1: \(n = 4\), \(\bar{x} = 2.5\), \(\overline{\ln y} = 1.732868\), \(S_{xx} = 5\), \(S_{xy} = 3.465735\), \(S_{yy} = 2.402224\). Khi đó \(B = e^{3.465735/5} = e^{0.693147} = 2\), \(A = e^{0} = 1\), và \(r = 1\). Vậy đường cong khớp được là \(y = 1\cdot 2^{x}\), đúng như mong đợi.
Câu hỏi thường gặp
Cột tần số dùng để làm gì? Nó gán trọng số cho mỗi điểm dữ liệu theo số lần điểm đó xuất hiện, nên một dòng có f = 5 được tính tương đương với năm dòng giống hệt nhau. Hãy để f = 1 ở mọi dòng nếu muốn hồi quy thông thường.
Đọc giá trị r như thế nào? \(|r| > 0.7\) cho thấy tương quan mạnh, 0.4–0.7 là trung bình, 0.2–0.4 là yếu, và dưới 0.2 thì gần như không có tương quan. r được tính trong không gian (x, ln y).
Tại sao y phải dương? Mô hình lấy logarit tự nhiên của y; ln y không xác định khi \(y \le 0\), nên các dòng có y không dương sẽ bị bỏ qua.