下側フェンスとは?
下側フェンス(lower fence)とは、データの「下側」にある外れ値を検出するための統計的な境界線です。この値を下回る数値は、外れ値の候補として扱われます。これは統計学者ジョン・テューキー(John Tukey)が広めた「1.5×IQRルール」の一部であり、箱ひげ図でひげの位置を引き、外れ値を特定する際に用いられる計算と同じものです。
この計算ツールの使い方
データの第1四分位数(Q1)と第3四分位数(Q3)を入力してください。本ツールは四分位範囲(IQR = Q3 − Q1)を求め、それに1.5を掛けた値をQ1から引くことで下側フェンスを算出します。上側フェンスと組み合わせて使うと、「正常」とみなせる値の範囲を上下から挟み込んで把握できます。
計算式の解説
計算式は $$\text{下側フェンス} = \text{Q1} - 1.5 \times \left( \text{Q3} - \text{Q1} \right)$$ です。まずQ3からQ1を引いてIQR(四分位範囲)を求めます。係数1.5は外れ値をどれだけ厳しく検出するかを決める値で、3.0のように大きくすると極端な外れ値だけを検出し、1.5は「軽度の」外れ値を捉える標準的な値とされています。
計算例
あるデータで \(\text{Q1} = 25\)、\(\text{Q3} = 75\) だとします。IQRは \(75 - 25 = 50\)。これに1.5を掛けると75となり、Q1から引くと $$25 - 75 = -50$$ です。つまり、−50を下回る観測値は下側の外れ値候補となります。
よくある質問(FAQ)
下側フェンスがマイナスになるのはなぜ? それは、現実的に小さい値であっても下側の外れ値として検出されることがない、ということを意味します。境界がデータの範囲よりも下にある状態で、データが左右対称、あるいは右に裾を引いた(右に歪んだ)分布のときによく見られます。
Q1とQ3はどうやって求めるの? データを小さい順に並べ替え、下半分の中央値(Q1)と上半分の中央値(Q3)を求めます。多くの表計算ソフトには QUARTILE 関数が用意されています。
なぜIQRの1.5倍なの? これは、おおむね正規分布に従うデータに対して、検出の感度と誤検出(偽陽性)のバランスをとる、広く受け入れられている慣習です。極端な外れ値だけを捉えたい場合は IQRの3.0倍 を使ってください。