通过MCP连接 →

输入计算

数学公式

广告

结果

正常取值范围(内限)
[-7.38, 31.62]
落在此范围之外的数值即为异常值
Q1(第 25 百分位数) 7.25
中位数(Q2) 11
Q3(第 75 百分位数) 17
IQR(Q3 − Q1) 9.75
下限 -7.38
上限 31.62
数据点个数 10
检测到的异常值 1

什么是 IQR 异常值计算器?

这款计算器会分析一组数字,并采用统计学家约翰·图基(John Tukey)提出的经典 1.5×IQR 法则 来识别统计上的异常值(离群点)。它会输出第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)、四分位距(IQR),以及划定"正常取值范围"的上下"内限"(fences)。凡是落在这两条内限之外的数值,都会被标记为潜在异常值。

使用方法

用逗号或空格分隔输入你的数据(例如 2, 5, 7, 8, 10, 12, 14, 18, 21, 45),然后提交。计算器会先把数字排序,再用线性插值法计算四分位数(与 R-7 算法及 Excel 的 PERCENTILE 函数一致),最后套用内限公式。小于下限或大于上限的数值即被判定为异常值。

公式解析

四分位距就是第 25 百分位数与第 75 百分位数之间的距离:\( \text{IQR} = Q_3 - Q_1 \)。内限在四分位数之外延伸 1.5 倍 IQR:

$$ \begin{aligned} \text{Lower} &= Q_1 - 1.5 \times \text{IQR} \\ \text{Upper} &= Q_3 + 1.5 \times \text{IQR} \end{aligned} $$

下限 = Q1 − 1.5·IQR上限 = Q3 + 1.5·IQR。系数 1.5 是图基提出的经典阈值;部分分析人员会改用 3.0,只标记那些"极度偏离"的极端值。

Advertisement
数轴上带有 IQR 箱体、须线、界限和离群点的箱线图
1.5×IQR 界限标出边界,超出这些边界的点会被判定为离群值。

实例演算

以数据集 2、5、7、8、10、12、14、18、21、45(\( n = 10 \))为例:\( Q_1 = 7.25 \),\( Q_3 = 17 \),因此 \( \text{IQR} = 9.75 \)。

$$ \text{Lower} = 7.25 - 1.5 \times 9.75 = -7.375 $$ $$ \text{Upper} = 17 + 1.5 \times 9.75 = 31.625 $$

其中数值 45 超过了上限,所以它就是唯一的异常值。

排序后的数据分为四个四分位,并标注 Q1、中位数和 Q3
四分位数把排序后的数据分成四等份;IQR 是 Q1 到 Q3 的距离。

常见问题

用的是哪种四分位数算法?采用顺序统计量之间的线性插值法(R-7),与 Excel 的 PERCENTILEQUARTILE 函数结果一致。

为什么是 1.5?这是图基约定俗成的乘数,对于近似正态分布的数据,它能在灵敏度与误报率之间取得较好的平衡。

内限可以是负数吗?可以——下限为负只是说明在偏小的一侧没有任何数值偏离到足以被视为异常值的程度。

最后更新: