평균제곱오차(MSE)란?
평균제곱오차(MSE, Mean Squared Error)는 예측값이 실제 관측값에 얼마나 가까운지를 측정하는 가장 널리 쓰이는 지표 중 하나입니다. 각 예측값(ŷ)과 그에 대응하는 실제값(y)의 차이를 제곱한 뒤 평균을 냅니다. 오차를 제곱하기 때문에 작은 오차보다 큰 오차에 더 큰 패널티가 부과되며, 결과값은 항상 0 이상입니다. 즉, 완벽한 모델은 정확히 0이 됩니다.
계산기 사용 방법
실제값과 예측값을 각각 쉼표로 구분한 두 개의 목록으로 입력하세요. 두 목록은 길이가 같아야 하며, 같은 순서의 예측값이 같은 위치의 실제값과 짝을 이루어야 합니다. 계산기는 입력된 순서대로 값을 짝지어 각 쌍의 제곱오차를 구한 다음, MSE와 함께 관련 지표인 RMSE(평균제곱근오차)와 SSE(오차제곱합)를 반환합니다. 두 목록의 길이가 다를 경우 겹치는 쌍만 사용해 계산합니다.
공식 풀이
MSE 공식은 다음과 같습니다.
$$\text{MSE} = \frac{1}{n}\sum_{i=1}^{n}\left(y_i - \hat{y}_i\right)^2$$각 데이터 포인트마다 실제값에서 예측값을 뺀 뒤 그 차이를 제곱하고, 모든 제곱오차를 더한 다음(이 값이 SSE), 마지막으로 데이터 개수 \(n\)으로 나눕니다. MSE에 제곱근을 취하면 RMSE가 되는데, RMSE는 원래 데이터와 단위가 같아 해석하기 편리합니다.
예제로 풀어보기
실제값이 3, −0.5, 2, 7이고 예측값이 2.5, 0.0, 2, 8이라고 가정해 봅시다. 오차는 각각 0.5, −0.5, 0, −1이 됩니다. 이를 제곱하면 0.25, 0.25, 0, 1이며, 모두 더하면 1.5(SSE)가 됩니다. 이를 \(n = 4\)로 나누면 MSE는 0.375가 되고, RMSE는 \(\sqrt{0.375} \approx 0.6124\)입니다.
자주 묻는 질문
좋은 MSE 값은 얼마인가요? 보편적인 기준값은 없습니다. MSE는 데이터의 규모(스케일)에 따라 달라지기 때문입니다. 값이 낮을수록 항상 좋고, 0이면 완벽하게 들어맞는 것입니다. 다른 모델이나 목표 변수의 분산과 비교해 평가하는 것이 좋습니다.
MSE와 RMSE의 차이는 무엇인가요? RMSE는 단지 MSE의 제곱근입니다. RMSE는 데이터와 단위가 같아 해석이 쉽기 때문에 결과를 보고할 때 더 선호되는 경우가 많습니다.
왜 절댓값 대신 오차를 제곱하나요? 제곱을 하면 함수가 매끄럽고 미분 가능해져(최적화에 유용함) 큰 오차에 더 강한 패널티를 줄 수 있습니다. 대안인 평균절대오차(MAE)는 모든 오차를 선형적으로 동일하게 다룹니다.