¿Qué es el error cuadrático medio?
El error cuadrático medio (MSE, por sus siglas en inglés) es una de las métricas más utilizadas para medir cuán cerca está un conjunto de predicciones de los valores reales observados. Calcula el promedio de las diferencias al cuadrado entre cada valor predicho (ŷ) y su correspondiente valor real (y). Como las diferencias se elevan al cuadrado, los errores grandes penalizan mucho más que los pequeños, y el resultado nunca es negativo: un modelo perfecto obtiene exactamente 0.
Cómo usar esta calculadora
Introduce tus valores reales y tus valores predichos como dos listas separadas por comas. Ambas listas deben tener la misma longitud, de modo que cada predicción se corresponda con el valor real situado en la misma posición. La calculadora empareja los datos en orden, calcula el error al cuadrado de cada par y devuelve el MSE junto con el RMSE (raíz del error cuadrático medio) y el SSE (suma de los errores al cuadrado). Si las dos listas tienen longitudes distintas, solo se usan los pares que coinciden.
La fórmula explicada
La fórmula del MSE es $$\text{MSE} = \frac{1}{n}\sum_{i=1}^{n}\left(y_i - \hat{y}_i\right)^2$$. Para cada dato se resta la predicción del valor real, se eleva al cuadrado esa diferencia, se suman todas las diferencias al cuadrado (esto es el SSE) y, por último, se divide entre el número de puntos \(n\). Al sacar la raíz cuadrada del MSE se obtiene el RMSE, que resulta cómodo porque comparte las mismas unidades que los datos originales.
Ejemplo resuelto
Supongamos que los valores reales son 3, −0,5, 2, 7 y las predicciones son 2,5, 0,0, 2, 8. Los errores son 0,5, −0,5, 0, −1. Al elevarlos al cuadrado obtenemos 0,25, 0,25, 0, 1, cuya suma es 1,5 (el SSE). Dividiendo entre \(n = 4\) obtenemos un MSE de 0,375, y el RMSE es \(\sqrt{0{,}375} \approx 0{,}6124\).
Preguntas frecuentes
¿Qué valor de MSE se considera bueno? No existe un umbral universal: el MSE depende de la escala de tus datos. Cuanto más bajo, mejor, y 0 significa un ajuste perfecto. Conviene compararlo con modelos alternativos o con la varianza de la variable objetivo.
¿Cuál es la diferencia entre el MSE y el RMSE? El RMSE es simplemente la raíz cuadrada del MSE. Suele preferirse para presentar resultados porque está en las mismas unidades que los datos y es más fácil de interpretar.
¿Por qué se elevan los errores al cuadrado en lugar de usar el valor absoluto? Elevar al cuadrado hace que la función sea suave y derivable (algo útil para la optimización) y penaliza con más fuerza los errores grandes. La alternativa, el error absoluto medio (MAE), trata todos los errores de forma lineal.