什么是均方根误差(RMSE)?
均方根误差(Root Mean Square Error,简称 RMSE)是衡量模型预测值与实际观测值偏离程度的常用指标之一。它用与原始数据相同的单位来表示预测误差的典型大小,因此结果直观、易于理解。RMSE 越小,说明拟合效果越好;当 RMSE 等于 0 时,意味着预测完全准确。
如何使用本计算器
请分别输入实际值和预测值两组数据,每组数值之间用逗号或空格分隔。两组数据的个数应保持一致;若数量不同,计算器会取前 n 对相互匹配的数据进行计算。点击「计算」后,即可看到 RMSE,同时还会显示均方误差(MSE)和平均绝对误差(MAE),方便你做更全面的对比。
计算公式详解
RMSE 的计算分为四步:(1)用每个实际值减去对应的预测值,得到误差;(2)对每个误差取平方,使正负误差不会相互抵消;(3)对所有平方误差求平均,得到 MSE;(4)再开平方根,把结果换算回原始数据的单位。由于平方运算会放大较大误差的权重,因此相比 MAE,RMSE 对离群值(异常值)更为敏感。
$$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} \left( \text{Actual}_i - \text{Predicted}_i \right)^2}$$
实例演示
假设实际值 = [3, -0.5, 2, 7],预测值 = [2.5, 0.0, 2, 8]。则各项误差为 0.5、-0.5、0、-1。取平方后得到 0.25、0.25、0、1,合计为 1.5。除以 \(n = 4\),得 \(\text{MSE} = 0.375\)。再开平方根,得 \(\text{RMSE} \approx 0.6124\)。而 MAE 为 $$\text{MAE} = \frac{0.5 + 0.5 + 0 + 1}{4} = 0.5$$
常见问题
RMSE 多大才算好?这完全取决于数据的量纲与取值范围。建议将 RMSE 与目标变量的取值区间或均值进行对比,或者与一个基准模型(baseline)作比较。
RMSE 和 MAE 有什么区别?RMSE 在求平均前会先对误差取平方,因此对较大误差的惩罚更重;而 MAE 则按误差大小成比例地对待所有误差。
RMSE 会出现负值吗?不会。因为它是「平方平均值」再开平方根的结果,所以 RMSE 始终大于或等于 0。