이 계산기로 무엇을 할 수 있나요
이 표준편차 계산기는 입력한 숫자 목록을 바탕으로 표본 표준편차를 즉시 계산하고, 평균·중앙값·분산·최솟값·최댓값·개수·합계까지 한눈에 보여 주는 요약 통계를 함께 제공합니다. 스프레드시트를 따로 열지 않고도 데이터가 얼마나 흩어져 있는지 빠르게 파악해야 하는 학생, 분석가, 연구자 등 누구에게나 유용합니다.
사용 방법
입력란은 숫자 입력(쉼표로 구분) 하나뿐입니다. 값을 쉼표, 세미콜론, 공백으로 구분해 입력하거나 붙여넣기만 하면 됩니다. 구분 기호는 자유롭게 사용할 수 있고, 빈 항목은 자동으로 제거됩니다. 예를 들어 4, 8, 15, 16, 23, 42를 입력하고 실행해 보세요.
- 평균(Mean) – 모든 값의 산술 평균
- 중앙값(Median) – 한가운데 값(50번째 백분위수)
- 표준편차(Standard deviation) – 값들이 평균에서 평균적으로 얼마나 벗어나는지
- 분산(Variance) – 표준편차의 제곱
- 최솟값·최댓값·개수·합계 – 데이터를 한눈에 보여 주는 기초 통계
공식 설명
이 계산기는 표본 표준편차 공식을 사용합니다.
$$s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}}$$
여기서 \(x_i\)는 각 숫자, \(\bar{x}\)는 평균, \(n\)은 값의 개수입니다. 나누는 값이 \(n\)이 아니라 \(n - 1\)이라는 점에 주목하세요. 이는 베셀 보정(Bessel's correction)으로, 데이터가 더 큰 모집단에서 추출한 표본일 때 편향 없는 추정값을 제공합니다. 분산은 단순히 \(s^2\)입니다.
예제로 계산해 보기
값 4, 8, 15, 16, 23, 42를 사용해 보겠습니다.
- 개수 = 6, 합계 = 108
- 평균 = 108 ÷ 6 = 18
- 편차의 제곱: (4−18)² + (8−18)² + (15−18)² + (16−18)² + (23−18)² + (42−18)² = 196 + 100 + 9 + 4 + 25 + 576 = 910
- 분산 = 910 ÷ (6 − 1) = 182
- 표준편차 = √182 ≈ 13.49
이 데이터의 중앙값은 가운데 두 값(15와 16)의 평균인 15.5입니다.
결과 해석
표준편차(SD)는 개별 값이 데이터셋의 평균으로부터 평균적으로 얼마나 떨어져 있는지를 나타냅니다. 이는 데이터와 동일한 단위로 보고되므로 직접 해석할 수 있습니다.
- 큰 표준편차 — 값들이 더 넓게 퍼져 있으며 평균 주위에서 크게 변동합니다.
- 작은 표준편차 — 값들이 평균 근처에 촘촘히 모여 있으며 더 일관성 있습니다.
- 표준편차 0 — 모든 값이 동일합니다(변동이 전혀 없음). 따라서 평균은 각 값과 같습니다.
표준편차는 데이터의 척도에 따라 달라지므로 다른 단위로 측정되거나 매우 다른 평균을 가진 데이터셋 간의 퍼짐을 비교하기 어렵습니다. 그럴 경우 변동계수$$\text{CV} = \frac{s}{\bar{x}} \times 100\%$$
예를 들어, \(s = 6\)이고 \(\bar{x} = 40\)인 데이터셋은 15%의 CV를 가집니다. 이는 퍼짐이 평균의 15%라는 뜻으로, 완전히 다른 척도의 데이터셋과 비교할 수 있는 상대적 척도입니다.
데이터가 대략 종 모양(대략 정규분포)일 때, 경험적 규칙은 표준편차가 분포와 어떻게 연관되는지 빠르게 파악할 수 있습니다:
- 약 68%의 값이 평균에서 1 표준편차 범위 내에 있습니다(\(\bar{x}-s\)와 \(\bar{x}+s\) 사이).
- 약 95%가 평균에서 2 표준편차 범위 내에 있습니다.
- 약 99.7%가 평균에서 3 표준편차 범위 내에 있습니다.
따라서 \(\bar{x}=100\)이고 \(s=10\)인 정규분포처럼 보이는 데이터의 경우, 대략 95%의 값이 80과 120 사이에 위치합니다. 2–3 표준편차를 넘어선 값들은 드물며 잠재적 이상치로 검토할 필요가 있을 수 있습니다.
정의 및 용어집
- 평균(\(\bar{x}\))
- 산술 평균 — 모든 값의 합을 개수로 나눈 값입니다. 편차가 측정되는 중심점입니다.
- 중앙값
- 데이터를 정렬했을 때의 중간값입니다. 짝수 개의 경우 두 중간값의 평균입니다. 평균보다 이상치의 영향을 덜 받습니다.
- 표준편차(s)
- 값이 평균으로부터의 전형적 거리로, 원래 단위입니다 — 분산의 제곱근입니다.
- 분산(\(s^2\))
- 평균으로부터의 제곱 편차의 평균입니다(\(n-1\)을 표본에 사용). 제곱 단위이므로 해석을 위해서는 표준편차를 선호합니다.
- 표본 vs 모집단
- 표본은 더 큰 그룹에서 추출한 부분집합으로 \(n-1\)로 나눕니다. 모집단은 모든 구성원을 포함하며 \(n\)으로 나눕니다. 이 도구는 표본 표준편차를 계산합니다.
- 베셀의 수정(\(n-1\))
- 표본을 사용할 때 \(n\) 대신 \(n-1\)로 나누는 것입니다. 표본 분산이 참 모집단 분산을 과소추정하는 경향을 보정합니다.
- 편차
- 개별 값과 평균 사이의 차이인 \(x_i - \bar{x}\)입니다. 이 편차들을 제곱하는 것이 분산 계산의 핵심입니다.
- 개수(n)
- 입력한 값의 개수 — 데이터셋의 크기입니다.
- 합
- 모든 값을 더한 총합입니다. 이를 개수로 나누면 평균을 얻습니다.
- 최솟값
- 데이터셋의 가장 작은 값입니다.
- 최댓값
- 데이터셋의 가장 큰 값입니다. 최댓값에서 최솟값을 뺀 것이 범위입니다.
자주 묻는 질문
표본 표준편차인가요, 모집단 표준편차인가요? 이 계산기는 \(n - 1\)로 나누는 표본 표준편차를 계산합니다. 모집단 값(\(n\)으로 나눔)이 필요하다면, 데이터가 많을 때는 차이가 거의 없지만 데이터가 적을수록 차이가 두드러집니다.
어떤 구분 기호를 쓸 수 있나요? 쉼표, 세미콜론, 공백, 줄바꿈 모두 사용할 수 있어 스프레드시트의 한 열을 그대로 붙여넣어도 됩니다.
왜 표준편차와 함께 분산도 표시하나요? 분산은 표준편차를 제곱한 값입니다. 분산은 통계 검정이나 분산분석(ANOVA)에서 유용하고, 표준편차는 데이터와 같은 단위로 표현되기 때문에 해석하기가 더 쉽습니다.