最頻値(モード)とは?
最頻値(モード)とは、データの中で最も多く出現する値のことです。平均値(算術平均)や中央値(真ん中の値)とは違い、最頻値は「出現する回数」だけに注目します。数値だけでなくカテゴリーデータにも使える唯一の代表値であり、コレクションの中で最も多い・最も人気のある項目を見つけたいときに役立ちます。
この計算ツールの使い方
入力欄に数値を、カンマまたはスペースで区切って入力してください。たとえば 2, 4, 4, 4, 6, 6, 9 のように入力します。「計算」を押すと、各値が何回出現するかを数え、最も出現回数の多い値と、その出現回数、最頻値の個数、入力した値の合計数を表示します。
計算式の考え方
数学的には、最頻値とは度数関数 \(f(x)\) を最大にする値 \(x\) のことです。$$\text{Mode} = \underset{x \,\in\, \text{Numbers}}{\arg\max}\; \operatorname{freq}(x)$$ 最も高い度数が2つ以上の値で並んだ場合、そのデータは多峰性(マルチモーダル)であり、それらすべてが最頻値になります。すべての値が同じ回数(それぞれ1回ずつ)しか出現しない場合は、最頻値なしとなります。
具体例で確認
データ 2, 4, 4, 4, 6, 6, 9 を考えてみましょう。値の4は3回、6は2回、2と9はそれぞれ1回ずつ出現します。最も高い出現回数は3で、これを満たすのは4だけなので、最頻値は4です。値は全部で7個あり、最頻値はちょうど1つです。
よくある質問(FAQ)
最頻値は2つ以上になることがありますか? はい、あります。複数の値が同じ最高出現回数を共有する場合、そのデータは二峰性(最頻値が2つ)または多峰性(3つ以上)となり、並んだ値すべてが結果として表示されます。
同じ値が繰り返されない場合はどうなりますか? すべての値が1回ずつしか出現しない場合、最頻値はありません。最も多く出現する値が存在しないためです。
最頻値は必ず数値でなければなりませんか? この計算ツールでは数値が対象です。ただし概念としては、アンケートで最も多かった目の色など、カテゴリーにも最頻値を適用できます。