MCP로 연결 →

계산 입력

공식

광고

결과

검출된 이상치
90.0
1 outlier(s) in 9 values
제1사분위수 (Q1) 13
제3사분위수 (Q3) 23.5
사분위 범위 (IQR) 10.5
하한 경계 (Q1 − 1.5·IQR) -2.75
상한 경계 (Q3 + 1.5·IQR) 39.25

이상치 계산기란?

이상치(outlier)란 나머지 데이터에서 멀리 떨어져 있는 값을 말합니다. 이 계산기는 널리 쓰이는 사분위 범위(IQR) 방법, 일명 'Tukey의 울타리(Tukey's fences)'를 사용해 유난히 높거나 낮은 값을 찾아냅니다. 숫자만 입력하면 사분위수, IQR, 하한·상한 경계, 그리고 검출된 이상치 목록을 한 번에 알려줍니다.

사용 방법

입력란에 데이터를 쉼표나 공백으로 구분해 넣으세요(예: 4, 5, 6, 7, 8, 100). 계산기는 값을 정렬한 뒤 제1사분위수(Q1), 제3사분위수(Q3), 사분위 범위를 계산하고, 사분위수에서 IQR의 1.5배를 넘어선 값을 이상치로 표시합니다.

공식 설명

사분위 범위는 \(\text{IQR} = Q_3 - Q_1\) 입니다. 경계(울타리)는 \(\text{LB} = Q_1 - 1.5\,\text{IQR}\), \(\text{UB} = Q_3 + 1.5\,\text{IQR}\) 로 구합니다. 하한보다 작거나 상한보다 큰 값은 모두 이상치로 봅니다.

$$\begin{gathered} \text{Outlier if} \quad x < \text{LB} \quad \text{or} \quad x > \text{UB} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} \text{IQR} &= Q_3 - Q_1 \\ \text{LB} &= Q_1 - 1.5\,\text{IQR} \\ \text{UB} &= Q_3 + 1.5\,\text{IQR} \\ x &\in \text{Data set} \end{aligned} \right. \end{gathered}$$

계수 1.5는 표준적으로 쓰는 값이며, '극단적' 이상치를 따질 때는 3.0을 쓰는 분석가도 있습니다.

광고
Q1, Q3, IQR, 하한·상한 울타리와 울타리를 벗어난 이상치 점을 보여주는 수직선 상자 그림
투키 울타리: \(Q_1 - 1.5\,\text{IQR}\) 또는 \(Q_3 + 1.5\,\text{IQR}\)를 벗어난 점은 이상치로 표시됩니다.

예제로 풀어보기

10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\))의 경우, 중앙값이 데이터를 아래쪽 절반 \(\{10, 12, 14, 15\}\)과 위쪽 절반 \(\{18, 20, 22, 25\}\)으로 나눕니다. \(Q_1 = (12+14)/2 = 13\), \(Q_3 = (20+22)/2 = 21\)이며, 다른 집합에서는 \(Q_3 = 23.5\)가 됩니다. \(\text{IQR} = 10.5\)이므로 하한은 \(-2.75\), 상한은 \(39.25\)입니다. 값 90은 39.25를 넘으므로 단 하나의 이상치로 표시됩니다.

자주 묻는 질문

어떤 사분위수 계산법을 쓰나요? 배제형 중앙값(exclusive median) 방법입니다. n이 홀수일 때 전체 중앙값을 양쪽 절반에서 모두 제외합니다.

왜 IQR의 1.5배인가요? John Tukey가 제안한 관례적인 기준값으로, 데이터의 일반적인 분포 범위를 벗어난 양쪽 꼬리 부분을 대략적으로 잡아냅니다.

이상치가 정상적인 값일 수도 있나요? 네. 이상치는 통계적으로 특이할 뿐, 반드시 오류라는 뜻은 아닙니다. 제거하기 전에 항상 원인을 확인하세요.

최종 업데이트: