중앙값 절대편차란?
중앙값 절대편차(MAD, Median Absolute Deviation)는 데이터의 흩어진 정도를 나타내는 견고한(robust) 통계 지표입니다. 이상치(outlier)에 크게 휘둘리는 표준편차와 달리, MAD는 중앙값을 기준으로 계산하기 때문에 극단값의 영향을 거의 받지 않습니다. 즉, 각 데이터가 중심에서 얼마나 떨어져 있는지를 안정적으로 보여 줍니다.
계산기 사용 방법
숫자를 쉼표나 공백으로 구분해 입력하세요(예: 2, 4, 6, 8, 10). 그러면 MAD는 물론 데이터 개수, 중앙값, 스케일 조정 MAD까지 함께 계산됩니다. 입력하는 즉시 결과가 갱신되므로 여러 데이터를 빠르게 비교할 수 있습니다.
공식 풀이
먼저 데이터의 중앙값을 구합니다. 그다음 각 값이 중앙값에서 얼마나 떨어져 있는지를 절댓값으로 계산합니다(\(|x_i - \operatorname{median}(x)|\)). 마지막으로 이 절대편차들의 중앙값을 구하면 됩니다.
$$\text{MAD} = \operatorname{median}\left(\left|\, x_i - \operatorname{median}(x) \,\right|\right)$$
스케일 조정 MAD는 여기에 상수 1.4826을 곱한 값입니다. 데이터가 정규분포를 따를 때 이 값은 표준편차의 일치추정량(consistent estimator) 역할을 합니다.
예제로 보기
데이터 1, 2, 3, 4, 5를 살펴봅시다. 중앙값은 3입니다. 각 값의 절대편차는 \(|1-3|=2\), \(|2-3|=1\), \(|3-3|=0\), \(|4-3|=1\), \(|5-3|=2\)로 2, 1, 0, 1, 2가 됩니다. 이를 정렬하면 0, 1, 1, 2, 2이고, 이 편차들의 중앙값은 1이므로 \(\text{MAD} = 1\)입니다. 스케일 조정 MAD는 \(1 \times 1.4826 = 1.4826\)이 됩니다.
자주 묻는 질문
표준편차 대신 MAD를 쓰는 이유는? MAD는 이상치에 강하기 때문에, 한쪽으로 치우친 데이터나 극단값이 섞인 데이터의 산포를 측정할 때 더 신뢰할 수 있습니다.
스케일 조정 MAD는 무엇을 의미하나요? 1.4826을 곱하면 MAD가 정규분포 데이터의 표준편차 추정값으로 변환됩니다. 덕분에 표준편차와 직접 비교할 수 있습니다.
숫자를 입력하는 순서가 중요한가요? 아니요. 계산기가 내부에서 자동으로 정렬하므로 어떤 순서로 입력해도 결과는 같습니다.