このツールでできること
数値のリストを入力するだけで、3つの四分位数(Q1・Q2・Q3)、四分位範囲(IQR)、中央値、最小値、最大値、そして範囲(レンジ)を一度に求められます。四分位数は並べ替えたデータを4等分する区切りの値で、IQRはデータの「真ん中半分」がどれだけばらついているかを示す指標です。外れ値の影響を受けにくい、頑健(ロバスト)なばらつきの尺度として広く使われています。
使い方
入力欄に数値を貼り付けるか、直接打ち込んでください。区切りはカンマ・スペース・タブ・改行のいずれでもOKなので、表計算ソフトの列をそのままコピー&ペーストしても問題なく動きます。負の数や小数にも対応しており、数値以外の文字は自動的に無視されます。入力後は結果を確認するだけ。IQRが強調表示され、その下の表に他のすべての統計量がまとめて表示されます。
計算方法(中央値を除外する方式)
このページでは Moore & McCabe の「排他的(exclusive)」方式を採用しています。まずデータを昇順に並べ替えます。中央値(Q2)は真ん中の値、データの個数が偶数のときは中央2つの値の平均です。続いてデータを下半分と上半分に分けます。ポイント:データの個数が奇数のときは、中央値そのものをどちらの半分にも含めません。Q1は下半分の中央値、Q3は上半分の中央値となり、最後に $$\text{IQR} = Q_3 - Q_1$$ で求めます。なお、ExcelのQUARTILE.INC関数やテューキー(Tukey)のヒンジなど他のツールでは流儀が異なるため、四分位数の値がわずかに違うことがあります。
計算例
データ:2, 4, 4, 5, 6, 7, 8(n = 7、奇数)。すでに昇順です。最小値 = 2、最大値 = 8、範囲 = 6。中央値(Q2)= 5。中央値を除いた下半分は [2, 4, 4] でその中央値は4なので \(Q_1 = 4\)。上半分は [6, 7, 8] でその中央値は7なので \(Q_3 = 7\)。したがって $$\text{IQR} = 7 - 4 = 3$$ となります。
よくある質問
なぜ奇数個のとき中央値を除外するの? これは Moore & McCabe をはじめ、多くの統計学入門の教科書で採用されている流儀です。四分位数が実際のデータ点と一致しやすくなるという利点があります。
IQRは外れ値の検出に使える? はい。\(Q_1 - 1.5 \times \text{IQR}\) より小さい値、または \(Q_3 + 1.5 \times \text{IQR}\) より大きい値を外れ値の候補とみなす方法がよく使われます。
Excelの結果と違うのはなぜ? ExcelのQUARTILE.INCは線形補間(包括的=inclusive方式)を用いるため、データ点の間の小数値になることがあります。この計算ツールはそれとは異なる排他的(exclusive)方式を採用しています。