什麼是五數概括?
五數概括是描述一組資料分布情形的簡潔方式,由五個數值組成:最小值、第一四分位數(Q1)、中位數(Q2)、第三四分位數(Q3)以及最大值。這五個數字能一次呈現資料的集中趨勢、離散程度與偏態,也是繪製盒鬚圖(盒形圖)的基礎。
如何使用本計算器
在輸入框中填入你的數字,可用逗號、空格或換行分隔。計算器會自動為資料排序,並回傳全部五個概括數值,同時計算四分位距(\(\text{IQR} = Q_3 - Q_1\))——也就是中間 50% 資料的離散範圍。
計算公式
資料排序後,中位數就是正中間的數值(若資料筆數為偶數,則取中間兩數的平均)。接著把資料分成下半部與上半部:Q1 是下半部的中位數,Q3 則是上半部的中位數。當資料筆數為奇數時,正中間的那一筆會被排除在上下兩半之外(即排除法/Tukey 方法)。最後,IQR 就是 \(Q_3 - Q_1\)。
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
範例解說
以資料集 2、4、6、8、10、12、14 為例。排序後,最小值為 2,最大值為 14。中位數是第 4 個數值,也就是 8。下半部為 \(\{2, 4, 6\}\),其中位數(Q1)為 4;上半部為 \(\{10, 12, 14\}\),其中位數(Q3)為 12。因此 $$\text{IQR} = 12 - 4 = 8.$$
常見問題
為什麼四分位數有不同的計算方法?不同的統計軟體採用不同的慣例。本工具使用常見的「排除法」,在處理奇數筆資料時,會把整體中位數排除於上下半部之外。
IQR 能告訴我什麼?它顯示中央一半資料的離散程度,常用來偵測離群值(即超出四分位數 \(1.5 \times \text{IQR}\) 範圍的數值)。
我至少需要幾個數字?至少要有兩筆資料,但資料點越多,四分位數的意義就越具參考價值。