MCP로 연결 →

계산 입력

공식

광고

결과

상한 울타리
150
이 값보다 큰 데이터는 잠재적 이상치입니다
1사분위수 (Q1) 25
3사분위수 (Q3) 75
사분위 범위 (IQR) 50

상한 울타리란?

상한 울타리(upper fence)는 데이터에서 비정상적으로 큰 값, 즉 높은 쪽 이상치를 가려내기 위한 통계적 기준선입니다. 상한 울타리보다 큰 값은 모두 잠재적 이상치로 표시되며, 따로 살펴볼 필요가 있는 데이터로 분류됩니다. 이 방식은 존 튜키(John Tukey)가 제안한 고전적인 이상치 탐지 기법의 일부로, 상자 수염 그림(box-and-whisker plot)에서 '수염(whisker)'을 그릴 때 쓰는 것과 같은 원리입니다.

Q1, Q3, IQR, 위쪽 울타리, 울타리를 넘는 이상치 점을 보여주는 수직선 상자그림
위쪽 울타리는 Q3의 오른쪽에 있으며 이를 넘는 점을 이상치로 표시합니다.

계산기 사용법

데이터의 1사분위수(Q1)와 3사분위수(Q3)를 입력하세요. 계산기가 사분위 범위(\(\text{IQR} = \text{Q3} - \text{Q1}\))를 구한 뒤 여기에 1.5를 곱하고, 그 값을 Q3에 더해 상한 울타리를 산출합니다. 사분위수를 아직 모른다면, 데이터를 크기순으로 정렬한 다음 아래쪽 절반의 중앙값(Q1)과 위쪽 절반의 중앙값(Q3)을 찾으면 됩니다.

공식 풀이

상한 울타리는 다음과 같이 정의됩니다.

$$\text{상한 울타리} = \text{Q3} + 1.5 \times \left(\text{Q3} - \text{Q1}\right)$$

여기서 \((\text{Q3} - \text{Q1})\)이 바로 사분위 범위(IQR)인데, 극단값의 영향을 받지 않는 안정적인 산포도 지표입니다. IQR에 1.5를 곱하면 일종의 허용 범위가 생기고, 이 범위를 Q3 위쪽으로 더하면 '비정상적으로 큰 값'을 가르는 기준선이 정해집니다.

광고
위쪽 울타리 공식 'Q3 + 1.5 × IQR'을 분해해 보여주는 다이어그램
이 공식은 Q3에 IQR의 1.5배를 더해 위쪽 경계를 정합니다.

예제로 보기

예를 들어 어떤 데이터의 \(\text{Q1} = 25\), \(\text{Q3} = 75\)라고 합시다. IQR은 다음과 같습니다.

$$\text{IQR} = 75 - 25 = 50$$

상한 울타리는 다음과 같이 됩니다.

$$75 + 1.5 \times 50 = 75 + 75 = 150$$

따라서 150보다 큰 값은 모두 잠재적인 높은 쪽 이상치로 간주됩니다.

자주 묻는 질문

왜 하필 1.5인가요? 1.5라는 계수는 존 튜키가 제시한 표준 배수입니다. 대략 정규분포에 가까운 데이터에서 민감도와 오탐(거짓 양성) 사이의 균형을 잘 잡아 줍니다. '극단적인' 이상치를 가려낼 때는 3.0을 배수로 쓰기도 합니다.

하한 울타리는 어떻게 구하나요? 짝이 되는 아래쪽 기준선은 \(\text{Q1} - 1.5 \times \text{IQR}\)입니다. 이 값보다 작은 값은 낮은 쪽 이상치에 해당합니다.

울타리를 넘는 값은 항상 오류인가요? 그렇지 않습니다. 단지 '확인해 볼 필요가 있다'는 표시일 뿐이며, 실제로 존재하는 진짜 극단값일 수도 있습니다.

최종 업데이트: