RMSE (Sai Số Toàn Phương Trung Bình) Là Gì?
RMSE (Root Mean Square Error – Sai số toàn phương trung bình) là một trong những chỉ số phổ biến nhất để đo lường mức độ chênh lệch giữa giá trị dự đoán của mô hình và giá trị quan sát (thực tế). RMSE thể hiện độ lớn điển hình của sai số dự đoán theo cùng đơn vị với dữ liệu gốc, nhờ vậy rất dễ diễn giải. RMSE càng nhỏ thì mô hình càng khớp tốt, và RMSE bằng 0 nghĩa là dự đoán hoàn toàn chính xác.
Cách Sử Dụng Công Cụ
Bạn hãy nhập danh sách giá trị thực tế và danh sách giá trị dự đoán dưới dạng hai dãy số, cách nhau bằng dấu phẩy hoặc khoảng trắng. Hai dãy nên có cùng số phần tử; nếu số lượng khác nhau, công cụ sẽ chỉ lấy n cặp đầu tiên trùng khớp. Nhấn nút tính toán để xem kết quả RMSE, cùng với Sai số toàn phương trung bình (MSE) và Sai số tuyệt đối trung bình (MAE) để có thêm góc nhìn đánh giá.
Giải Thích Công Thức
RMSE được tính qua bốn bước:
$$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} \left( \text{Actual}_i - \text{Predicted}_i \right)^2}$$(1) lấy giá trị thực tế trừ đi giá trị dự đoán tương ứng để có sai số, (2) bình phương từng sai số để các giá trị âm và dương không triệt tiêu lẫn nhau, (3) lấy trung bình các sai số bình phương này để ra MSE, và (4) khai căn bậc hai để đưa kết quả về đúng đơn vị ban đầu. Việc bình phương khiến những sai số lớn có trọng số cao hơn, nên RMSE nhạy cảm với các điểm ngoại lai (outlier) hơn so với MAE.
Ví Dụ Minh Họa
Giả sử giá trị thực tế = [3, -0.5, 2, 7] và giá trị dự đoán = [2.5, 0.0, 2, 8]. Các sai số lần lượt là \(0.5, -0.5, 0, -1\). Sau khi bình phương: \(0.25, 0.25, 0, 1\), tổng lại bằng \(1.5\). Chia cho \(n = 4\) ta được \(\text{MSE} = 0.375\). Khai căn bậc hai cho \(\text{RMSE} \approx 0.6124\). Còn \(\text{MAE} = (0.5 + 0.5 + 0 + 1)/4 = 0.5\).
Câu Hỏi Thường Gặp
Giá trị RMSE bao nhiêu là tốt? Điều này hoàn toàn phụ thuộc vào thang đo của dữ liệu. Hãy so sánh RMSE với khoảng giá trị hoặc giá trị trung bình của biến mục tiêu, hoặc đối chiếu với một mô hình cơ sở (baseline).
RMSE khác MAE ở điểm nào? RMSE bình phương sai số trước khi lấy trung bình, nên phạt nặng những sai số lớn; trong khi MAE xử lý mọi sai số một cách tỷ lệ tuyến tính như nhau.
RMSE có thể âm không? Không. Vì đây là căn bậc hai của trung bình các bình phương, nên RMSE luôn bằng 0 hoặc dương.