RMSE(二乗平均平方根誤差)とは?
RMSE(Root Mean Square Error:二乗平均平方根誤差)は、モデルの予測値が実測値からどれだけ離れているかを測る、最もよく使われる指標のひとつです。予測誤差のおおよその大きさを元データと同じ単位で表すため、結果を直感的に解釈できます。RMSEが小さいほど当てはまりが良く、RMSEが0であれば予測が完全に一致していることを意味します。
この計算ツールの使い方
実測値と予測値を、それぞれカンマまたはスペースで区切ったリストとして入力します。2つのリストは要素数を揃えてください。数が異なる場合は、先頭から一致する n 組のペアのみが計算に使われます。「計算」ボタンを押すと、RMSEに加えて、参考指標として平均二乗誤差(MSE)と平均絶対誤差(MAE)も表示されます。
計算式の解説
RMSEは次の4ステップで求めます。
$$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} \left( \text{Actual}_i - \text{Predicted}_i \right)^2}$$(1)各実測値から予測値を引いて誤差を求める、(2)正負の誤差が打ち消し合わないよう、それぞれの誤差を二乗する、(3)二乗した誤差を平均してMSEを得る、(4)平方根をとって元の単位に戻す——という流れです。二乗することで大きな誤差ほど強く反映されるため、RMSEはMAEに比べて外れ値の影響を受けやすい指標になっています。
計算例
実測値 = [3, -0.5, 2, 7]、予測値 = [2.5, 0.0, 2, 8] の場合を考えてみましょう。誤差はそれぞれ \(0.5\)、\(-0.5\)、\(0\)、\(-1\) です。二乗すると \(0.25\)、\(0.25\)、\(0\)、\(1\) となり、合計は \(1.5\) です。これを \(n = 4\) で割ると \(\text{MSE} = 0.375\)。その平方根をとって \(\text{RMSE} \approx 0.6124\) となります。MAE は \((0.5 + 0.5 + 0 + 1) \div 4 = 0.5\) です。
よくある質問
RMSEはどれくらいなら「良い」と言えますか? 良し悪しはデータの尺度に完全に依存します。対象とする変数の範囲や平均値、あるいはベースラインとなるモデルと比較して判断しましょう。
RMSEとMAEはどう違いますか? RMSEは誤差を二乗してから平均するため、大きな誤差により重いペナルティを与えます。一方MAEはすべての誤差を比例的に同等に扱います。
RMSEがマイナスになることはありますか? ありません。RMSEは二乗の平均の平方根なので、常に0以上の値になります。