什麼是均方誤差?
均方誤差(Mean Squared Error,簡稱 MSE)是衡量一組預測值與實際觀測值有多接近的常用指標之一。它計算每個預測值(\(\hat{y}\))與對應實際值(\(y\))之間差距的平方,再取平均。由於誤差經過平方處理,較大的偏差會被加重懲罰,而小誤差的影響相對輕微;計算結果永遠不會是負數——完美的模型分數正好是 0。
如何使用這個計算器
請將你的實際值與預測值分別以逗號分隔的方式輸入兩個欄位。兩份清單的數量應該相同,且每個預測值要與相同位置的實際值一一對應。計算器會依序配對,逐一計算每組的平方誤差,最後回傳 MSE,並一併提供相關的 RMSE(均方根誤差)與 SSE(誤差平方和)。若兩份清單長度不一致,只會採用能成功配對的部分。
公式解析
MSE 的公式為 $$\text{MSE} = \frac{1}{n}\sum_{i=1}^{n}\left(y_i - \hat{y}_i\right)^2$$。對每一筆資料,先用實際值減去預測值,再將差值平方,接著把所有平方誤差加總(這就是 SSE),最後除以資料筆數 \(n\)。將 MSE 開平方根即可得到 RMSE,這個指標的方便之處在於它與原始資料使用相同的單位。
實際範例
假設實際值為 3、−0.5、2、7,而預測值為 2.5、0.0、2、8。各組誤差為 0.5、−0.5、0、−1。平方後得到 0.25、0.25、0、1,加總為 1.5(即 SSE)。再除以 \(n = 4\),得到 MSE 為 0.375,而 RMSE 則為 \(\sqrt{0.375} \approx 0.6124\)。
常見問題
MSE 多少才算好?並沒有一個通用的標準門檻——MSE 會隨著資料的尺度而變化。數值越低越好,0 代表完美擬合。建議將它與其他替代模型,或與目標變數的變異數相互比較。
MSE 與 RMSE 有什麼差別?RMSE 其實就是 MSE 的平方根。在報告結果時通常更偏好使用 RMSE,因為它與資料採用相同單位,更容易解讀。
為什麼要把誤差平方,而不是取絕對值?平方能讓函數變得平滑且可微分(對最佳化很有幫助),同時加重懲罰較大的誤差。另一種替代指標——平均絕對誤差(MAE)——則是以線性方式看待所有誤差。