Ortalama Karesel Hata nedir?
Ortalama Karesel Hata (MSE), bir dizi tahminin gerçek gözlem değerlerine ne kadar yakın olduğunu ölçmek için en sık kullanılan metriklerden biridir. Her tahmin değeri (ŷ) ile ona karşılık gelen gerçek değer (y) arasındaki farkların karelerinin ortalamasını alır. Hatalar kare alındığı için büyük sapmalar küçük sapmalara göre çok daha ağır cezalandırılır ve sonuç her zaman sıfır veya pozitiftir; kusursuz bir model tam olarak 0 değerini alır.
Bu hesaplayıcı nasıl kullanılır?
Gerçek değerlerinizi ve tahmin değerlerinizi virgülle ayrılmış iki ayrı liste olarak girin. Listeler aynı uzunlukta olmalı ve her tahmin değeri, aynı sıradaki gerçek değerle eşleşmelidir. Hesaplayıcı bu değerleri sırasıyla eşleştirir, her çift için karesel hatayı hesaplar ve MSE'nin yanı sıra ilgili RMSE (karekök ortalama karesel hata) ile SSE (karesel hataların toplamı) değerlerini verir. İki liste farklı uzunluktaysa yalnızca örtüşen çiftler dikkate alınır.
Formülün açıklaması
MSE formülü $$\text{MSE} = \frac{1}{n}\sum_{i=1}^{n}\left(y_i - \hat{y}_i\right)^2$$ şeklindedir. Her veri noktası için tahmini gerçek değerden çıkarır, bu farkın karesini alır, tüm karesel farkları toplar (bu toplam SSE'dir) ve son olarak nokta sayısı \(n\)'e bölersiniz. MSE'nin karekökünü almak ise RMSE'yi verir; bu metrik orijinal verilerle aynı birime sahip olduğu için yorumlaması oldukça kolaydır.
Çözümlü örnek
Diyelim ki gerçek değerler 3, −0,5, 2, 7 ve tahminler 2,5, 0,0, 2, 8 olsun. Hatalar sırasıyla 0,5, −0,5, 0, −1 olur. Karelerini aldığımızda 0,25, 0,25, 0, 1 elde ederiz; bunların toplamı 1,5'tir (SSE). \(n = 4\)'e böldüğümüzde MSE 0,375 çıkar, RMSE ise \(\sqrt{0{,}375} \approx 0{,}6124\) olur.
Sıkça Sorulan Sorular
İyi bir MSE değeri kaçtır? Evrensel bir eşik yoktur; MSE verilerinizin ölçeğine bağlıdır. Her zaman daha düşük olması daha iyidir ve 0 değeri kusursuz bir uyumu gösterir. Sonucu alternatif modellerle ya da hedef değişkenin varyansıyla karşılaştırarak değerlendirin.
MSE ile RMSE arasındaki fark nedir? RMSE, yalnızca MSE'nin kareköküdür. RMSE verilerle aynı birime sahip olduğu ve yorumlaması daha kolay olduğu için raporlamada genellikle tercih edilir.
Hataların mutlak değeri yerine neden karesi alınır? Kare almak fonksiyonu sürekli ve türevlenebilir kılar (optimizasyon için yararlıdır) ve büyük hataları daha güçlü biçimde cezalandırır. Alternatif yöntem olan Ortalama Mutlak Hata (MAE) ise tüm hataları doğrusal olarak ele alır.