MCPで接続 →

計算を入力してください

公式

広告

結果

平均値(average)
20.4
sum ÷ count
中央値 6
最頻値 No mode
データ数(n) 5
合計 102
範囲 76

このツールでできること

この計算ツールは、任意の数値リストについて、代表値となる3つの指標をまとめて求めます。すなわち 平均値(mean/算術平均)中央値(median)、そして 最頻値(mode/最も多く出る値) の3つです。さらにデータ数・合計・範囲も同時に表示するため、データ全体の傾向をひと目で把握できます。成績やテストの点数、価格、測定値、アンケート結果など、あらゆる数値データに使えます。

使い方

入力欄に数値を、カンマまたはスペースで区切って入力します。たとえば 4, 8, 15, 16, 23, 42 のように入力してください。小数やマイナスの値もそのまま使えます。計算ボタンを押すと、ツールが値を並べ替えて合計し、各指標を瞬時に返します。表計算ソフトからコピーした縦長の列をそのまま貼り付けてもOK。余分なスペースや改行は自動的に処理されます。

計算式の解説

平均値は、すべての値の合計を値の個数で割ったものです(\(\text{平均} = \sum x \div n\))。

$$\text{平均} = \frac{\sum_{i=1}^{n} x_i}{n}, \quad x_i \in \text{Numbers}$$

中央値は、数値を小さい順に並べたときにちょうど真ん中にくる値です。値の個数が偶数のときは、中央にある2つの値の平均をとります。最頻値は、最も多く現れる値です。データには最頻値が1つだけの場合もあれば、複数ある場合(多峰性)、あるいはすべての値が1回ずつでまったく存在しない場合もあります。

広告
数直線上で、平均値を釣り合いの点、中央値を真ん中の値、最頻値を最も多く現れる値として示した図
平均値・中央値・最頻値は、データの中心をそれぞれ違う方法で表します。

計算例

データ 2, 4, 4, 6, 9 を例に考えてみましょう。合計は \(2 + 4 + 4 + 6 + 9 = 25\) で、値は5個あるので、平均値は \(25 \div 5 = 5\) です。

$$\text{平均} = \frac{2 + 4 + 4 + 6 + 9}{5} = \frac{25}{5} = 5$$

小さい順に並べると真ん中(3番目)の値は 4 なので、中央値は4。値4は2回登場し、他のどの値より多いため、最頻値は 4 です。範囲は \(9 - 2 = 7\) となります。

数字のタイルの集合と、そこから平均値・中央値・最頻値を求める手順を示した解説例
1つのサンプルデータから平均値・中央値・最頻値を求める。

結果の解釈

中心傾向の3つの指標は同じ広い質問——「典型的な値とは何か?」——に答えていますが、データの形に対して異なる反応を示すため、これらを一緒に読むことは、1つだけを読むよりも情報的です。

平均と中央値が乖離する場合

完全に対称なデータセットでは、平均と中央値は等しくなります。それらが分離するとき、その差はスキュー(歪度)を示します。平均が中央値より明らかに大きい場合、異常に高い値(右スキュー、つまり高い外れ値)がいくつか平均を上方に引っ張っています。平均が中央値より小さい場合、低い値がそれを下方に引きずっています(左スキュー)。平均はすべての値を加えるため、単一の極端な観測値が平均を大きく変位させることができますが、中央値——ソート済みリストの中間——はほとんど動きません。所得、住宅価格、応答時間など、スキューの入ったデータでは、中央値は通常、より代表的な「典型的な」値です。

多峰性の結果が部分群を示す場合

最頻値は最も頻繁に出現する値です。単一の明確な最頻値は、データが1つの中心の周りにクラスタ化していることを示唆しています。2つ以上の最頻値(二峰性または多峰性の結果)は、データセットが実際には異なる部分群を混合していることが多いということを意味します——例えば2つの異なるクラスからのテストスコア、または2つの異なる条件下で測定されたデータ。そのような場合、単一の平均または中央値は、実際には「どちらの」グループにも典型的でない値を説明することができるため、データを分割して別々に分析すべきかどうかを確認する価値があります。

範囲がばらつきをどのように示すか

範囲は最大値から最小値を引いたものであり、1つの数値でデータの全体の幅を捉えています。平均に対して小さい範囲は、値が密集していることを示しており、大きい範囲はより大きなばらつきまたは外れ値の存在を示しています。範囲は最も極端な2つのポイントのみを使用するため、外れ値に敏感であり、その間の値がどのように分布しているかについては何も言いません——分散の完全な画像が必要な場合は、標準偏差または分散とペアにしてください。

このセクションは標準的な統計的解釈のみを説明しており、個人的、財務的、または専門的なアドバイスではありません。

平均、中央値、最頻値がデータセット間でどのように比較するか

以下の4つのデータセットは、各々が同様の数の値を含みますが、異なる形状を持っています。平均が対称なデータの中央値を追跡しますが、外れ値またはスキューが導入されると分離することに注意してください。一方、最頻値は反復性とクラスタ化を強調します。

データセット 平均 中央値 最頻値 範囲
対称 4, 5, 6, 7, 8 6 6 なし 4
右スキュー(高い外れ値) 4, 5, 6, 7, 80 20.4 6 なし 76
二峰性(2つの部分群) 2, 2, 2, 9, 9, 9 5.5 5.5 2 および 9 7
すべて一意 3, 11, 14, 22, 30 16 14 なし 27

右スキューのセットでは、値8を80に置き換えると中央値は6のままで変わりませんが、平均を20.4に上げます——1つの外れ値がどのように平均を歪めるのに対して、中央値がどのようにロバスト(堅牢)であるかの明確なデモンストレーション。二峰性のセットは2つの最頻値を返します。これは、2つのクラスタ(各々2および9に中心)が結合されていることの統計的な手がかりです。すべて一意のセットは、値が繰り返されないため、最頻値をまったく持ちません。

広告

定義と用語集

平均(算術平均)
すべての値の合計を値の数で割ったもの、\(\bar{x} = \frac{\sum x_i}{n}\)。すべての値を使用するため、外れ値に敏感です。
中央値
データがソートされた順序で並べられたときの中央の値。偶数の個数がある場合、それは2つの中央の値の平均です。極端な値にほぼ影響を受けません。
最頻値
最も頻繁に出現する値(または値)。データセットは1つの最頻値、複数の最頻値、または値がすべて一意である場合はない可能性があります。
中心傾向
データセットの中心または「典型的な」レベルを要約する単一の値。平均、中央値、最頻値は3つの一般的な指標です。
多峰性
2つ以上の最頻値を持つこと。2つの最頻値は二峰性と呼ばれます。多峰性データは、異なる部分群の混合を示すことが多いです。
範囲
最大値と最小値の差、\(\text{range} = x_{\max} - x_{\min}\)。全体的なばらつきの単純な指標です。
数(n)
データセット内の値の数——平均を計算するときに使用される除数。
合計
すべての値を一緒に加算することによって得られた合計、\(\sum x_i\)。平均の分子です。
外れ値
残りのデータから遠く離れている値。外れ値は平均と範囲に強く影響しますが、中央値にはほとんど影響を与えません。
ソート済み / 順序付きデータ
最小から最大に配列された値。順序付けは、中央値を特定し、範囲の最小値と最大値を読み取るために必要です。

よくある質問

同じ値が一つもない場合はどうなりますか? その場合は最頻値が存在せず、ツールには「最頻値なし」と表示されます。

最頻値が複数になることはありますか? あります。最も出現回数が多い値が2つ以上で並んだ場合は、そのすべてが最頻値として表示されます。

どの代表値を使えばよいですか? 平均値は左右対称に分布したデータに向いています。一方、極端に大きい・小さい外れ値があるときは、中央値の方が信頼できます。中央値はそうした異常な値に引っ張られにくいためです。

最終更新: