通过MCP连接 →

输入计算

数学公式

广告

结果

下界栅栏
-50
低于此值的数据为潜在离群值
第一四分位数 (Q1) 25
第三四分位数 (Q3) 75
四分位距 (IQR) 50

什么是下界栅栏?

下界栅栏(Lower Fence)是一种统计边界,用来识别数据集中偏低一端的离群值。任何低于下界栅栏的数值,都会被标记为潜在的离群值。它属于由统计学家约翰·图基(John Tukey)推广的经典「1.5 × IQR 法则」,与箱线图(box-and-whisker plot)中绘制须线、判定离群值所用的计算方法完全相同。

数轴上的箱线图,下限位于箱体左侧
下限标示出一条界线,低于该界线的数据点会被判定为离群值。

如何使用本计算器

输入数据集的第一四分位数(Q1)和第三四分位数(Q3)。计算器会先求出四分位距(\( \text{IQR} = \text{Q3} - \text{Q1} \)),再将其乘以 1.5,然后从 Q1 中减去这一数值,得到下界栅栏。将它与上界栅栏(Upper Fence)配合使用,就能框定「正常」数值的取值范围。

公式详解

公式为 $$\text{下界栅栏} = \text{Q1} - 1.5 \times \left( \text{Q3} - \text{Q1} \right)$$。先用 Q3 减去 Q1 求出 IQR。其中的系数 1.5 决定了判定离群值的「严格程度」——系数越大(例如 3.0),只会标记出极端离群值;而 1.5 则是判定「轻度」离群值的常规取值。

Advertisement
示意图显示下限位于 Q1 下方 1.5 倍 IQR 的位置
下限位于第一四分位数(Q1)下方 \( 1.5 \times \text{IQR} \) 处。

实例演示

假设某数据集的 \( \text{Q1} = 25 \),\( \text{Q3} = 75 \)。则 IQR 为 \( 75 - 25 = 50 \)。乘以 1.5 得到 75,再从 Q1 中减去: $$25 - 75 = -50$$ 任何小于 \( -50 \) 的观测值,都属于偏低端的潜在离群值。

常见问题

下界栅栏为负数意味着什么? 这只是说明在现实中不会有偏小的数值被判为低端离群值——边界已经落在你数据取值范围的下方。当数据呈对称分布或右偏(正偏)时,这种情况很常见。

如何得到 Q1 和 Q3? 先将数据从小到大排序,然后取下半部分的中位数作为 Q1,取上半部分的中位数作为 Q3。许多电子表格软件都提供 QUARTILE(四分位数)函数。

为什么是 1.5 倍 IQR? 这是一个被广泛接受的惯例,对于近似正态分布的数据,它能在灵敏度与误报率之间取得平衡。如果你只想捕捉极端离群值,可以改用 \( 3.0 \times \text{IQR} \)。

最后更新: