四分位数とは?
四分位数とは、小さい順に並べたデータを4等分する区切りの値です。第1四分位数(Q1)は25パーセンタイルにあたり、全体の25%がこの値より下に位置します。第2四分位数(Q2)は中央値で、50パーセンタイルです。第3四分位数(Q3)は75パーセンタイルを示します。これら3つを見れば、データの大半がどのあたりに集まり、どのくらいばらついているのかをひと目で把握できます。
このツールの使い方
入力欄に数値をカンマまたはスペースで区切って入力し(例:3, 7, 8, 5, 12)、計算ボタンを押してください。値は自動的に並べ替えられるため、入力順は気にする必要はありません。Q1・Q2・Q3に加え、四分位範囲(IQR=Q3−Q1)、さらに参考として最小値・最大値・データ数も表示されます。
計算の仕組み(計算式)
このツールは、多くの統計ソフトウェアでも採用されている線形補間法を使用しています。パーセンタイルpに対して、0始まりで並べ替えたデータ上の順位 \(r = \frac{p}{100}(n-1)\) を求めます(nはデータ数)。rが整数のときはその位置の値がそのまま四分位数となり、整数でないときは小数部分の割合に応じて隣り合う2つの値を補間して算出します。
$$Q_p = x_{\lfloor r \rfloor} + (r - \lfloor r \rfloor)\,(x_{\lceil r \rceil} - x_{\lfloor r \rfloor}),\quad r = \frac{p}{100}(n-1)$$
計算例
データ 3, 7, 8, 5, 12, 14, 21, 13, 18 で考えてみましょう。並べ替えると 3, 5, 7, 8, 12, 13, 14, 18, 21(\(n = 9\))です。Q1は \(r = 0.25 \times 8 = 2\) となり、インデックス2の値 = 7。Q2は \(r = 0.5 \times 8 = 4\) で、インデックス4の値 = 12。Q3は \(r = 0.75 \times 8 = 6\) で、インデックス6の値 = 14。したがって \(Q_1 = 7\)、\(Q_2 = 12\)、\(Q_3 = 14\)、\(IQR = 14 - 7 = 7\) となります。
よくある質問
他の計算ツールと結果が違うのはなぜ? 四分位数の求め方には複数の方法があります(中央値を含める方式・含めない方式など)。このツールは(n − 1)に基づく線形補間法を採用しており、これはNumPyの既定値や多くの表計算ソフトのPERCENTILE関数と一致する、広く使われている方法です。
IQRは何に使うの? 四分位範囲(IQR)は、データの中央50%がどれだけ広がっているかを表す指標です。外れ値の検出にも使われ、\(Q_1 - 1.5 \times IQR\) より小さい値、または \(Q_3 + 1.5 \times IQR\) より大きい値が外れ値の目安とされます。
小数やマイナスの数値も入力できる? はい。カンマまたはスペースで区切れば、どんな実数でも入力できます。