왜도란 무엇인가요?
왜도(skewness)는 확률분포나 데이터 집합이 평균을 기준으로 얼마나 비대칭인지를 나타내는 지표입니다. 왜도가 0이면 좌우 대칭인 분포를 의미합니다. 왜도가 양수이면 오른쪽 꼬리가 길게 늘어진 형태로(큰 값들이 평균을 위로 끌어올림), 음수이면 왼쪽 꼬리가 길게 늘어진 형태입니다. 이 계산기는 모집단 왜도 또는 편향이 보정된 표본 왜도를 평균, 표준편차와 함께 알려 줍니다.
사용 방법
숫자를 쉼표나 공백으로 구분해 입력한 뒤 계산 방법을 선택하세요. 데이터가 관심 대상 전체를 나타낼 때는 모집단을, 더 큰 모집단에서 뽑아낸 표본일 때는 표본을 선택합니다. 표본 방법은 엑셀의 SKEW 함수와 여러 통계 패키지에서 사용하는 보정된 피셔-피어슨 추정량입니다.
공식 풀이
모집단 왜도는 표준화된 편차를 세제곱한 값의 평균입니다:
$$g_1 = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{\sigma} \right)^{3}$$여기서 \(\sigma\)는 \(n\)으로 나눠 계산합니다. 표본 버전에는 보정 계수가 적용됩니다:
$$G_1 = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^{3}$$여기서 \(s\)는 \(n-1\)로 나눠 계산합니다. 이 보정은 표본 크기가 작을 때 발생하는 하향 편향을 제거해 줍니다.
계산 예시
데이터 2, 4, 6, 8, 20의 경우 평균은 8입니다. \(\sum (x_i-\bar{x})^3 = (-6)^3+(-4)^3+(-2)^3+(0)^3+(12)^3 = -216-64-8+0+1728 = 1440\) 입니다. 모집단 표준편차 \(\sigma = \sqrt{160/5} = 6.3246\) 이므로
$$g_1 = \frac{1440/5}{6.3246^3} = \frac{288}{252.98} \approx 1.1384$$입니다. 표본 방법에서는 \(s = \sqrt{160/4} = 7.0711\) 이고,
$$G_1 = \frac{5}{4\cdot 3}\cdot\frac{1440}{353.55} = 0.4167\cdot 4.0729 \approx 1.6971$$입니다.
자주 묻는 질문
두 방법의 결과가 왜 다른가요? 두 방법은 서로 다른 표준편차를 사용하며, 표본 방법은 편향 보정 계수까지 더하기 때문에 데이터가 적을수록 값의 크기 차이가 커집니다.
값이 0에 가깝다는 것은 무슨 의미인가요? 분포가 거의 대칭이라는 뜻입니다. 일반적으로 ±1을 넘는 값은 비대칭(쏠림)이 심한 것으로 봅니다.
어떤 값을 사용해야 하나요? 표본으로부터 모집단을 추정할 때는 표본 추정량을, 데이터 전체를 가지고 있을 때는 모집단 왜도를 사용하세요.