Công cụ này làm gì?
Công cụ giúp bạn khớp một đường cong hồi quy logarit có dạng \(y = A + B\ln(x)\) với một bảng quan sát, trong đó mỗi dòng mang theo một tần số (trọng số) f. Việc gắn trọng số tần số cho phép bạn nhập dữ liệu đã gộp nhóm hoặc lặp lại một cách gọn gàng: thay vì liệt kê cùng một cặp (x, y) nhiều lần, bạn chỉ cần ghi một lần kèm số lần xuất hiện f. Đây là phương pháp thuần thống kê, hoạt động giống hệt nhau ở mọi nơi — không phụ thuộc đơn vị đo hay quy định của bất kỳ quốc gia nào.
Cách sử dụng
Nhập mỗi nhóm quan sát trên một dòng theo định dạng x y f. Cột tần số là tùy chọn; nếu bỏ trống, mỗi dòng được tính một lần (\(f = 1\)). Mọi giá trị x phải lớn hơn 0 vì công cụ lấy logarit tự nhiên của x. Hãy nhập ít nhất hai dòng với các giá trị x khác nhau để xác định được đường hồi quy. Bạn có thể chọn độ chính xác hiển thị (mặc định 10 chữ số có nghĩa) — tùy chọn này chỉ thay đổi cách làm tròn số được hiển thị, không bao giờ ảnh hưởng đến phép tính bên trong.
Giải thích công thức
Với các nhóm i = 1..m, đặt \(n = \sum f_i\). Các trung bình có trọng số là \(\text{meanLnX} = \frac{\sum f_i \ln x_i}{n}\) và \(\text{meanY} = \frac{\sum f_i y_i}{n}\). Các tổng bình phương có trọng số là
$$S_{xx} = \sum f_i (\ln x_i)^2 - n\cdot\text{meanLnX}^2$$$$S_{yy} = \sum f_i y_i^2 - n\cdot\text{meanY}^2$$$$S_{xy} = \sum f_i \ln x_i\, y_i - n\cdot\text{meanLnX}\cdot\text{meanY}$$Khi đó \(B = \frac{S_{xy}}{S_{xx}}\), \(A = \text{meanY} - B\cdot\text{meanLnX}\), và
$$r = \frac{S_{xy}}{\sqrt{S_{xx}}\,\sqrt{S_{yy}}}$$
Ví dụ minh họa
Dùng năm dòng với tất cả \(f = 1\) — (1,2), (2,3), (3,3), (4,4), (5,4) — ta có \(\text{meanLnX} = 0{,}9574984\), \(\text{meanY} = 3{,}2\), \(S_{xx} = 1{,}6154888\), \(S_{yy} = 2{,}8\), \(S_{xy} = 2{,}0382328\). Suy ra \(B = 1{,}2616933\), \(A = 1{,}9919295\) và \(r = 0{,}9583567\). Đường cong khớp được là \(y = 1{,}9919 + 1{,}2617\ln(x)\) với mức tương quan rất mạnh.
Câu hỏi thường gặp
Cột tần số có tác dụng gì? Nó gắn trọng số cho mỗi dòng. Một dòng có \(f = 5\) được xem như năm quan sát giống hệt nhau, nên ảnh hưởng đến kết quả khớp gấp năm lần một dòng có \(f = 1\).
Đọc hệ số r như thế nào? \(|r|\) trên 0,7 là tương quan mạnh, 0,4–0,7 là trung bình, 0,2–0,4 là yếu, và dưới 0,2 thì gần như không có tương quan.
Vì sao báo "không thể khớp"? Để khớp được, cần ít nhất hai giá trị x khác nhau (nếu không \(S_{xx} = 0\)) và tổng tần số dương. Mọi giá trị x phải lớn hơn 0 để \(\ln(x)\) được xác định.