这个计算器能做什么
只要输入一组数字,本工具就会自动算出三个四分位数(Q1、Q2、Q3)、四分位距(IQR)、中位数、最小值、最大值以及极差。四分位数会把排好序的数据均分为四等份;而 IQR 衡量的是数据中间一半的离散程度——它是一种稳健的变异性指标,不会被极端值(离群值)拉偏,这正是它好用的地方。
如何使用
把你的数值粘贴或输入到文本框里即可。数字之间可以用逗号、空格、制表符或换行隔开,所以直接从 Excel 表格里复制一整列也完全没问题。负数和小数都支持,非数字的内容会被自动忽略。提交后即可查看结果:IQR 会被重点标出,其余各项统计量都列在下方表格中。
计算方法(排除中位数法)
本页面采用 Moore & McCabe 的"排除式(exclusive)"方法。首先对数据排序,中位数(Q2)即正中间的那个数;如果数据个数为偶数,则取中间两个数的平均值。接着把数据分成下半部分和上半部分。关键规则:当数据个数为奇数时,中位数本身要从上下两半中都排除掉。Q1 是下半部分的中位数,Q3 是上半部分的中位数,最后 \(\text{IQR} = Q_3 - Q_1\)。其他工具(例如 Excel 的 QUARTILE.INC、Tukey 铰值法)由于采用不同的约定,算出的四分位数可能会略有出入。
实例演示
数据:2、4、4、5、6、7、8(n = 7,为奇数,已排好序)。最小值 = 2,最大值 = 8,极差 \(= \text{Max} - \text{Min} = 8 - 2 = 6\)。中位数(Q2)= 5。排除中位数后的下半部分为 [2, 4, 4],其中位数为 4,所以 Q1 = 4。上半部分为 [6, 7, 8],其中位数为 7,所以 Q3 = 7。因此 $$\text{IQR} = Q_3 - Q_1 = 7 - 4 = 3.$$
常见问题
为什么奇数个数据要排除中位数?这是 Moore & McCabe 以及许多统计学入门课程所采用的约定,这样算出的四分位数更容易正好落在真实的数据点上。
IQR 可以用来识别离群值吗?可以。一个常用的规则是:把小于 \(Q_1 - 1.5 \times \text{IQR}\) 或大于 \(Q_3 + 1.5 \times \text{IQR}\) 的数值标记为潜在离群值。
为什么我的结果和 Excel 不一样?Excel 的 QUARTILE.INC 使用线性插值(即包含式方法),算出的四分位数可能是介于两个数据点之间的小数。而本计算器采用的是排除式方法,因此结果会有差异。