모분산이란?
모분산(\(\sigma^2\))은 데이터 전체가 평균을 중심으로 얼마나 흩어져 있는지를 나타내는 값입니다. 표본분산과 달리, 편차 제곱의 합을 N−1이 아닌 전체 데이터 개수 N으로 나눕니다. 즉, 가지고 있는 데이터가 표본이 아니라 모집단 전체일 때 모분산을 사용합니다.
계산기 사용 방법
입력란에 데이터 값을 쉼표나 공백으로 구분해 넣으면 됩니다(예: 4, 8, 6, 5, 3, 8). 계산기는 평균을 구한 뒤 각 값에서 평균을 빼고, 그 편차를 제곱해 모두 더한 다음 데이터 개수로 나눕니다. 그 결과 분산, 평균, 편차 제곱합, 모표준편차를 즉시 확인할 수 있습니다.
공식 풀이
모분산 공식은 다음과 같습니다.
$$\sigma^2 = \frac{1}{n}\sum_{i=1}^{n}\left(x_i - \mu\right)^2$$여기서 \(\mu\)는 모평균, \(x_i\)는 각 데이터 값, \(n\)은 데이터 개수, \(\sum\)는 "합"을 뜻합니다. 각 값이 평균에서 떨어진 거리를 제곱하는 이유는, 음수와 양수 편차가 서로 상쇄되는 것을 막기 위해서입니다. 모표준편차 \(\sigma\)는 분산에 제곱근을 씌운 값일 뿐입니다.
예제로 살펴보기
데이터 4, 8, 6, 5, 3, 8을 예로 들어 보겠습니다. 평균은 다음과 같습니다.
$$\mu = \frac{4+8+6+5+3+8}{6} = \frac{34}{6} \approx 5.6667$$각 편차의 제곱은 다음과 같으며,
$$\begin{aligned}(4-5.6667)^2 &= 2.7778 \\ (8-5.6667)^2 &= 5.4444 \\ (6-5.6667)^2 &= 0.1111 \\ (5-5.6667)^2 &= 0.4444 \\ (3-5.6667)^2 &= 7.1111 \\ (8-5.6667)^2 &= 5.4444\end{aligned}$$이들의 합은 21.3333 입니다. 이를 \(n=6\)으로 나누면 다음과 같습니다.
$$\sigma^2 \approx 3.5556, \qquad \sigma \approx 1.8856$$자주 묻는 질문
모분산과 표본분산 중 무엇을 써야 하나요? 가지고 있는 숫자가 모집단 전체라면 모분산(\(\div N\))을 사용하고, 더 큰 모집단을 추정하기 위한 표본이라면 표본분산(\(\div N-1\))을 사용하세요.
분산이 음수가 될 수 있나요? 아니요. 편차를 제곱하기 때문에 분산은 항상 0 이상입니다. 모든 값이 동일할 때만 0이 됩니다.
분산의 단위는 무엇인가요? 분산은 데이터 단위의 제곱으로 표현됩니다. 원래 단위로 되돌리려면 제곱근을 취해 표준편차로 환산하면 됩니다.