平均二乗誤差(MSE)とは?
平均二乗誤差(Mean Squared Error、MSE)は、予測値が実測値にどれだけ近いかを測るために最もよく使われる指標のひとつです。各予測値(ŷ)と対応する実測値(y)との差を二乗し、その平均を取って算出します。誤差を二乗するため、小さなズレよりも大きなズレが強く反映されるのが特徴です。値は常に0以上となり、誤差がまったくない完璧なモデルではちょうど0になります。
この計算ツールの使い方
実測値と予測値を、それぞれカンマ区切りのリストとして入力します。2つのリストは同じ要素数にし、各予測値が同じ位置にある実測値と対応するように並べてください。本ツールは順番どおりにペアを作り、各ペアの二乗誤差を計算して、MSEに加えて関連指標であるRMSE(二乗平均平方根誤差)とSSE(誤差二乗和)も返します。なお、2つのリストの長さが異なる場合は、重なっている範囲のペアのみが使用されます。
計算式の解説
MSEの計算式は $$\text{MSE} = \frac{1}{n}\sum_{i=1}^{n}\left(y_i - \hat{y}_i\right)^2$$ です。各データ点について、実測値から予測値を引き、その差を二乗します。すべての二乗誤差を合計したものがSSEで、これをデータ点の数 \(n\) で割るとMSEが得られます。さらにMSEの平方根を取るとRMSEになり、元のデータと同じ単位で表せるため解釈しやすいという利点があります。
計算例
実測値が 3、−0.5、2、7 で、予測値が 2.5、0.0、2、8 だとします。このとき誤差は 0.5、−0.5、0、−1 となります。これらを二乗すると 0.25、0.25、0、1 になり、合計は 1.5(これがSSE)です。\(n = 4\) で割ると MSE は 0.375、RMSE は \(\sqrt{0.375} \approx 0.6124\) となります。
よくある質問(FAQ)
MSEはどのくらいの値なら良いのですか? 万能な基準値はありません。MSEはデータのスケールに依存するためです。値は小さいほど良く、0なら完全な当てはまりを意味します。他のモデルと比較したり、目的変数の分散と比べたりして評価しましょう。
MSEとRMSEの違いは? RMSEはMSEの平方根にすぎません。RMSEはデータと同じ単位で表せて解釈しやすいため、結果を報告する際によく好んで使われます。
なぜ絶対値ではなく誤差を二乗するのですか? 二乗すると関数が滑らかで微分可能になり(最適化に便利です)、大きな誤差をより強く反映できます。一方、代わりに使われる平均絶対誤差(MAE)は、すべての誤差を線形に扱います。