什么是五数概括?
五数概括是对一组数据分布情况的简明描述,由五个关键数值组成:最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)以及最大值。这五个数字能直观地反映数据的中心位置、离散程度和偏态,也是绘制箱线图(盒须图)的基础。
如何使用本计算器
在输入框中填入你的数据,数字之间用逗号、空格或换行分隔即可。计算器会自动排序,并给出全部五个概括数值,同时计算出四分位距(\(\text{IQR} = Q_3 - Q_1\))——它衡量的是中间 50% 数据的离散程度。
计算公式
数据排序后,中位数就是位于中间的那个值(若数据个数为偶数,则取中间两个值的平均数)。接着将数据分成下半部分和上半部分:Q1 是下半部分的中位数,Q3 是上半部分的中位数。当数据个数为奇数时,中间的那个值不计入任何一半(即排除法 / Tukey 法)。IQR 就等于 \(Q_3 - Q_1\)。
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
实例演示
以数据集 2、4、6、8、10、12、14 为例。排序后,最小值为 2,最大值为 14。中位数是第 4 个值,即 8。下半部分为 \(\{2, 4, 6\}\),其中位数 Q1 为 4;上半部分为 \(\{10, 12, 14\}\),其中位数 Q3 为 12。因此 $$\text{IQR} = 12 - 4 = 8.$$
常见问题
为什么四分位数有多种计算方法?不同的统计软件采用不同的约定。本工具使用常见的「排除法」,即在拆分奇数个数据时不把整体中位数纳入任意一半。
IQR 能告诉我什么?它反映了中间一半数据的离散程度,常用于识别离群值(即偏离四分位数超过 \(1.5 \times \text{IQR}\) 的数值)。
至少需要多少个数据?最少需要两个数值,但数据点越多,四分位数的结果越具有参考意义。