透過 MCP 連接 →

輸入計算

數學公式

廣告

結果

上界
150
高於此值者即為潛在離群值
第一四分位數(Q1) 25
第三四分位數(Q3) 75
四分位距(IQR) 50

什麼是上界(Upper Fence)?

上界是統計上用來判定資料中「偏高」離群值的一條界線。任何高於上界的數值,都會被標示為潛在的離群值,值得進一步檢視。它源自經典的 Tukey 離群值偵測法,也正是盒鬚圖(box-and-whisker plot)中繪製「鬚線」所依據的方法。

數線上的盒鬚圖,顯示 Q1、Q3、IQR、上界以及界外的一個離群點
上界位於 Q3 右側,將超出它的點標記為離群值。

如何使用這個計算器

輸入資料的第一四分位數(Q1)與第三四分位數(Q3)。計算器會先算出四分位距(\(\text{IQR} = \text{Q3} - \text{Q1}\)),再乘以 1.5,最後加回 Q3,即得上界。如果你還不知道自己的四分位數,可以先將資料由小到大排序,取下半部的中位數作為 Q1、上半部的中位數作為 Q3。

公式解析

上界的定義為 $$\text{Upper Fence} = \text{Q3} + 1.5 \times \left(\text{Q3} - \text{Q1}\right)$$ 其中 \(\text{Q3} - \text{Q1}\) 即為四分位距,是一種不受極端值影響、相當穩健的離散程度衡量。將 IQR 乘以 1.5 形成一個容許範圍;把這個範圍往 Q3 之上延伸,就劃定了判定「異常偏大」觀測值的門檻。

Advertisement
拆解上界公式的示意圖:Q3 加 1.5 倍 IQR
此公式將 1.5 倍 IQR 加到 Q3 上,以決定上界。

實例演算

假設某筆資料的 \(\text{Q1} = 25\)、\(\text{Q3} = 75\)。則 IQR 為 \(75 - 25 = 50\)。上界即為 $$75 + 1.5 \times 50 = 75 + 75 = 150$$ 換句話說,任何大於 150 的資料點,都會被視為潛在的高側離群值。

常見問題

為什麼是 1.5?係數 1.5 是 John Tukey 提出的標準乘數,對於近似常態分配的資料而言,能在「靈敏度」與「誤判」之間取得平衡。若要標示更嚴重的「極端」離群值,有時會改用 3.0 這個乘數。

那下界(Lower Fence)呢?對應的下界為 \(\text{Q1} - 1.5 \times \text{IQR}\)。低於下界的數值,屬於低側離群值。

超過上界就一定代表資料錯誤嗎?不一定。它只是把該資料點標記出來供你檢查——它有可能是真實存在、只是數值偏大的觀測值。

最後更新: