IQR外れ値計算ツールとは?
この計算ツールは、入力した数値の並びを分析し、統計学者ジョン・テューキーが提唱した有名な1.5×IQRルールを使って統計的な外れ値を見つけ出します。第1四分位数(Q1)、中央値(Q2)、第3四分位数(Q3)、四分位範囲(IQR)に加え、「正常」とみなされる値の範囲を区切る下限・上限の「境界値(フェンス)」を算出します。この境界の外側にある数値は、外れ値の候補として表示されます。
使い方
カンマまたはスペースで区切ってデータを入力し(例:2, 5, 7, 8, 10, 12, 14, 18, 21, 45)、送信してください。ツールが数値を並べ替え、線形補間(ExcelのPERCENTILE関数と同じR-7方式)で四分位数を計算し、境界値の公式を適用します。下限より小さい値、または上限より大きい値が外れ値としてカウントされます。
計算式の解説
四分位範囲とは、25パーセンタイルと75パーセンタイルの差のことです:\( \text{IQR} = Q_3 - Q_1 \)。境界値は、四分位数からIQRの1.5倍だけ外側へ広げた位置になります。
$$\begin{aligned} \text{Lower} &= Q_1 - 1.5 \times \text{IQR} \\ \text{Upper} &= Q_3 + 1.5 \times \text{IQR} \end{aligned}$$係数1.5は古典的なテューキーの基準値です。分析者によっては、より極端な「far out(はるか外側)」の値だけを判定するために3.0を使うこともあります。
計算例
データ 2, 5, 7, 8, 10, 12, 14, 18, 21, 45(\(n = 10\))の場合:\(Q_1 = 7.25\)、\(Q_3 = 17\) となるため、\(\text{IQR} = 9.75\) です。 $$\text{Lower} = 7.25 - 1.5 \times 9.75 = -7.375$$ $$\text{Upper} = 17 + 1.5 \times 9.75 = 31.625$$ 値45は上限を超えているため、これが唯一の外れ値となります。
よくある質問
どの四分位数の計算方法を使っていますか? 順序統計量の間を線形補間する方式(R-7)で、ExcelのPERCENTILE関数およびQUARTILE関数と一致します。
なぜ1.5なのですか? 1.5は、ほぼ正規分布に従うデータにおいて感度と誤検出のバランスを取るための、テューキーが定めた慣例的な乗数だからです。
境界値がマイナスになることはありますか? はい。下限がマイナスになるのは、低い側に外れ値とみなせるほど極端な値が存在しない、ということを意味するだけです。