Hồi quy lũy thừa là gì?
Hồi quy lũy thừa giúp khớp mô hình \(y = A \cdot x^{B}\) với một tập hợp các điểm dữ liệu. Dạng đường cong này xuất hiện rất phổ biến trong vật lý, sinh học và kinh tế — bất cứ khi nào một đại lượng tăng theo lũy thừa của đại lượng khác, chẳng hạn như tăng trưởng dị tốc (allometric growth), đường cong học tập và nhiều quy luật tỷ lệ khác. Số mũ B cho biết tốc độ tỷ lệ, còn hệ số A xác định độ lớn tổng thể của mô hình.
Cách sử dụng máy tính
Bạn hãy nhập các giá trị X và Y dưới dạng danh sách, cách nhau bằng dấu phẩy hoặc khoảng trắng, và ghép theo đúng vị trí (X đầu tiên đi với Y đầu tiên, cứ thế tiếp tục). Mọi giá trị bắt buộc phải dương vì phép khớp sử dụng logarit tự nhiên; bất kỳ dòng nào có giá trị bằng 0 hoặc nhỏ hơn 0 sẽ bị bỏ qua. Chọn số chữ số có nghĩa muốn hiển thị, sau đó đọc kết quả các hệ số cùng hệ số tương quan r.
Giải thích công thức
Bí quyết nằm ở việc tuyến tính hóa. Lấy logarit tự nhiên cả hai vế của \(y = A \cdot x^{B}\), ta được \(\ln y = \ln A + B \cdot \ln x\) — một đường thẳng trong các biến đã biến đổi \(t = \ln x\) và \(u = \ln y\). Sau đó ta áp dụng hồi quy bình phương tối thiểu thông thường: tính các giá trị trung bình, tổng bình phương \(S_{xx}\) và \(S_{yy}\), cùng tích chéo \(S_{xy}\). Độ dốc \(B = S_{xy}/S_{xx}\) chính là số mũ, còn \(A = \exp(\overline{\ln y} - B \cdot \overline{\ln x})\). Hệ số tương quan \(r = S_{xy}/\sqrt{S_{xx} \cdot S_{yy}}\) đo mức độ thẳng hàng của các điểm sau khi biến đổi log.
Ví dụ minh họa
Với bộ dữ liệu (1,2), (2,5), (3,11), (4,21), (5,33) và \(n = 5\), các tổng theo log cho ra \(S_{xx} \approx 1{,}6155\), \(S_{xy} \approx 2{,}8340\) và \(S_{yy} \approx 5{,}0410\). Khi đó $$B = \frac{2{,}8340}{1{,}6155} \approx 1{,}7544$$ và $$A = \exp(2{,}2483 - 1{,}7544 \cdot 0{,}9575) \approx 1{,}7655.$$ Hệ số tương quan \(r \approx 0{,}9933\), tức là mức khớp rất tốt. Mô hình thu được là \(y \approx 1{,}7655 \cdot x^{1{,}7544}\).
Câu hỏi thường gặp
Vì sao mọi giá trị đều phải dương? Phương pháp này lấy \(\ln(x)\) và \(\ln(y)\); mà logarit của 0 hoặc của số âm là không xác định, nên những điểm không dương không thể đưa vào tính toán.
Đọc hệ số tương quan r như thế nào? Nếu \(|r|\) trên 0,7 thì mối quan hệ rất mạnh; 0,4–0,7 là trung bình; 0,2–0,4 là yếu; và dưới 0,2 thì gần như không có mối liên hệ nào.
Dùng logarit tự nhiên hay logarit cơ số 10 có khác nhau không? Không — số mũ B và hệ số tương quan r đều giống hệt nhau trong cả hai trường hợp. Chúng tôi dùng logarit tự nhiên và tính A nhất quán với hàm exp(), nên kết quả khớp với các tài liệu tham khảo chuẩn.