中央値とは?
中央値とは、データを小さい順に並べたときにちょうど真ん中にくる値のことです。すべての値を足して割る「平均値(平均)」とは違い、中央値は極端に大きい値や小さい値(外れ値)の影響を受けにくいのが特徴です。そのため、所得や住宅価格のように分布が偏りやすいデータでは、中心的な傾向を表す指標として中央値が特に役立ちます。
このツールの使い方
数値をカンマまたはスペースで区切って入力欄に打ち込むだけです(例:4, 8, 15, 16, 23, 42)。ツールが自動で並べ替えて中央値を求め、あわせてデータの個数・合計・平均値も表示します。入力できる数値の個数に上限はありません。
計算式の解説
まず値を小さい順に並べ替えます。データの個数nが奇数のときは、(n+1)/2 番目にある値が中央値です。nが偶数のときはちょうど真ん中の値が1つに定まらないため、中央寄りの2つの値、つまり n/2 番目と n/2+1 番目の値の平均が中央値になります。
$$\text{Median} = \begin{cases} x_{\frac{n+1}{2}} & n \text{ odd} \\[0.6em] \dfrac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2} & n \text{ even} \end{cases}$$
$$x = \operatorname{sort}\left(\text{Numbers}\right)$$
計算例
4, 8, 15, 16, 23, 42 というデータを考えてみましょう。すでに小さい順に並んでおり、値は6個(偶数)です。真ん中の2つの値は 15 と 16 なので、中央値は \((15 + 16) / 2 = 15.5\) となります。次に 3, 7, 9 という値が3個(奇数)のデータでは、真ん中の値はそのまま 7 です。
よくある質問
中央値と平均は同じものですか? いいえ、違います。平均(平均値)はすべての値を足して個数で割ったものですが、中央値はあくまで順番の真ん中にある値です。データに偏りがあると、両者は大きく異なることがあります。
なぜ平均ではなく中央値を使うのですか? 中央値は外れ値に強いからです。極端に大きい値や小さい値が1つあるだけで平均は典型的な値から大きくずれてしまいますが、中央値はほとんど動きません。
あらかじめ数値を並べ替えておく必要はありますか? いいえ。ツールが自動で並べ替えてくれるので、その必要はありません。