카이제곱 계산기란?
이 계산기는 적합도 검정에 사용하는 카이제곱(χ²) 통계량을 계산해 줍니다. 카이제곱 검정은 특정 가설 아래에서 기대되는 빈도와 실제로 관측된 빈도가 얼마나 잘 일치하는지를 측정하는 방법입니다. χ² 값이 클수록 관측값과 기댓값 사이의 차이가 크다는 뜻입니다. 생물학, 마케팅, 유전학, 품질 관리, 사회과학 등 다양한 분야에서 두루 쓰이는 보편적인 통계 도구입니다.
사용 방법
먼저 관측값(O)을 쉼표로 구분해 입력한 다음, 같은 순서로 대응하는 기댓값(E)을 입력하세요. 각 쌍이 하나의 범주(카테고리)에 해당합니다. 계산기는 χ² 통계량, 사용된 범주의 개수, 그리고 자유도(범주 수에서 1을 뺀 값)를 알려줍니다. 원하는 유의수준(예: 0.05)에서 카이제곱 분포표의 임계값과 계산된 χ²를 비교해 귀무가설을 기각할지 여부를 판단하면 됩니다.
공식 설명
카이제곱 통계량은 다음과 같이 정의됩니다.
$$\chi^2 = \sum_{i=1}^{k} \frac{\left(O_i - E_i\right)^2}{E_i}$$
각 범주마다 관측값에서 기댓값을 뺀 다음, 그 결과를 제곱하고 기댓값으로 나눕니다. 그리고 모든 항을 더하면 됩니다. 제곱을 하기 때문에 모든 항이 양수가 되며, 큰 편차일수록 더 크게 반영되어 차이가 두드러집니다.
예제로 살펴보기
주사위를 던지면서 각 면이 똑같은 확률로 나올 것이라고 기대한다고 가정해 봅시다. 관측값이 90, 60, 110, 40이고 기댓값이 80, 80, 80, 40이라고 하겠습니다. 각 항의 기여도는 \((90-80)^2/80 = 1.25\), \((60-80)^2/80 = 5\), \((110-80)^2/80 = 11.25\), \((40-40)^2/40 = 0\)입니다. 이를 모두 더하면 자유도 3에서 \(\chi^2 = 17.5\)가 나옵니다.
자주 묻는 질문
자유도란 무엇인가요? 적합도 검정에서 자유도(df)는 범주의 개수에서 1을 뺀 값입니다.
χ²가 크다는 것은 무슨 의미인가요? 값이 클수록 관측 데이터가 기댓값에서 더 많이 벗어났다는 뜻이며, 이는 세운 가설이 잘 맞지 않을 수 있음을 시사합니다.
기댓값이 0이어도 되나요? 안 됩니다. 기대 빈도가 0이면 0으로 나누는 셈이 되어 값이 정의되지 않으므로, 해당 범주는 계산에서 제외됩니다.