五数要約とは?
五数要約は、データの分布をコンパクトに表す指標です。最小値、第1四分位数(Q1)、中央値(Q2)、第3四分位数(Q3)、最大値の5つの数値で構成されます。これらをまとめて見ることで、データの中心・ばらつき・偏り(歪み)が一目で分かり、箱ひげ図を作成する際の基礎にもなります。
このツールの使い方
入力欄に数値を入力します。区切りはカンマ、スペース、改行のいずれでも構いません。ツールが自動的に並べ替え、5つの要約値に加えて四分位範囲(\(\text{IQR} = Q_3 - Q_1\))を算出します。IQRは、データの中央50%がどれだけ広がっているかを表す指標です。
計算式
データを並べ替えた後、中央値は真ん中の値(データ数が偶数の場合は中央の2つの値の平均)になります。次に、データを下半分と上半分に分割します。Q1は下半分の中央値、Q3は上半分の中央値です。データ数が奇数の場合、全体の中央値はどちらの半分にも含めません(排他的方式/チューキー法)。IQRは単純に\(Q_3 - Q_1\)で求められます。
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
計算例
データセット 2, 4, 6, 8, 10, 12, 14 を例に考えます。並べ替えると、最小値は2、最大値は14です。中央値は4番目の値である8になります。下半分は {2, 4, 6} で、その中央値(Q1)は4です。上半分は {10, 12, 14} で、その中央値(Q3)は12です。IQRは \(12 - 4 = 8\) となります。
$$\text{IQR} = Q_3 - Q_1 = 12 - 4 = 8$$よくある質問
なぜ四分位数の計算方法が複数あるのですか? 統計ソフトによって採用している方式が異なります。本ツールでは一般的な「排他的方式」を採用しており、データ数が奇数のときは全体の中央値を除外して上下に分割します。
IQRから何が分かりますか? データの中央半分がどれだけ広がっているかを示し、外れ値の検出(四分位数から \(1.5 \times \text{IQR}\) を超える値)にも使われます。
最低何個の数値が必要ですか? 最低2個の値が必要です。ただし、データ点が多いほど四分位数の意味がより明確になります。