這個計算機能做什麼
這個計算機可以針對任何一串數字,算出三種最核心的集中趨勢量數:平均數(算術平均值)、中位數(位於中間的數值)以及眾數(出現次數最多的數值)。同時它還會列出資料的個數、總和與全距,讓你一眼掌握整組資料的統計概況。無論是成績、考試分數、價格、量測數據、問卷結果,或任何數值型資料,都能輕鬆處理。
使用方法
在輸入框中鍵入你的數字,並以逗號或空格分隔,例如 4, 8, 15, 16, 23, 42。小數和負數都可以輸入。按下計算後,工具會自動將數值排序、加總,並立即回傳每一項統計結果。你也可以直接從試算表複製一整欄數字貼上,多餘的空格與換行都會自動處理。
公式解析
平均數是把所有數值加總後,再除以數值的個數:
$$\text{平均數} = \frac{\sum x}{n}$$中位數則是把數字排序後取中間的那一個;當數值的個數為偶數時,中位數就是中間兩個數值的平均。眾數是出現次數最多的數值。一組資料可能只有一個眾數、有多個眾數(多眾數),也可能在每個數值都不重複時完全沒有眾數。
實際範例
以這組資料 2, 4, 4, 6, 9 為例。總和是 \(2 + 4 + 4 + 6 + 9 = 25\),共有 5 個數值,因此平均數為 \(25 \div 5 = 5\)。排序後,位於中間(第 3 個)的數值是 4,所以中位數是 4。數值 4 出現了兩次,比其他數值都多,因此眾數是 4。全距則為 \(9 - 2 = 7\)。
解釋您的結果
集中趨勢的三項測量回答了相同的廣泛問題——「典型值是什麼?」——但它們對數據形狀的反應方式不同,因此同時閱讀它們比單獨閱讀任何一項更具有信息性。
當平均值和中位數出現分歧時
在完全對稱的數據集中,平均值和中位數相等。當它們分離時,這個差距表示偏度:如果平均值明顯大於中位數,則一些異常高的值(右偏態或高異常值)將平均值向上拉;如果平均值小於中位數,則低值將其向下拖動(左偏態)。因為平均值添加每個值,單個極端觀察可以大幅改變它,而中位數——排序列表的中間——幾乎不動。對於傾斜的數據,如收入、房價或反應時間,中位數通常是更具代表性的「典型」值。
當多峰結果表示子組時
眾數是最常見的值。單個清晰的眾數表示數據圍繞一個中心聚集。兩個或多個眾數(雙峰或多峰結果)通常意味著數據集實際上混合了不同的子組——例如來自兩個不同班級的考試成績,或在兩種不同條件下進行的測量。當發生這種情況時,單個平均值或中位數可能描述一個實際上對任何組都不典型的值,因此值得檢查數據是否應該分開並單獨分析。
範圍如何指示分散
範圍是最大值減去最小值,因此它以一個數字捕捉數據的全部寬度。相對於平均值的小範圍表示值緊密聚集;大範圍表示分散更大或存在異常值。範圍僅使用兩個最極端的點,因此它對異常值敏感,並且說不出介於兩者之間的值如何分佈——當您需要更完整的離散度圖景時,可以將其與標準差或方差配對。
本節僅說明標準統計解釋,不構成個人、財務或專業建議。
平均值、中位數和眾數在數據集中的比較
下面的四個數據集每個都包含相似數量的值但具有不同的形狀。注意平均值如何跟蹤中位數的對稱數據,但一旦引入異常值或偏度就偏離它,而眾數突出了重複和聚集。
| 數據集 | 值 | 平均值 | 中位數 | 眾數 | 範圍 |
|---|---|---|---|---|---|
| 對稱 | 4, 5, 6, 7, 8 | 6 | 6 | 無 | 4 |
| 右偏(高異常值) | 4, 5, 6, 7, 80 | 20.4 | 6 | 無 | 76 |
| 雙峰(兩個子組) | 2, 2, 2, 9, 9, 9 | 5.5 | 5.5 | 2和9 | 7 |
| 全部唯一 | 3, 11, 14, 22, 30 | 16 | 14 | 無 | 27 |
在右偏集中,將值8替換為80將中位數保持在6不變,但將平均值提升至20.4——清楚地演示了一個異常值如何扭曲平均值,同時中位數保持穩健。雙峰集返回兩個眾數,這是統計線索表明兩個集群(各自以2和9為中心)已被組合。全部唯一集根本沒有眾數,因為沒有值重複。
定義與詞彙表
- 平均值(算術平均)
- 所有值的總和除以值的個數,\(\bar{x} = \frac{\sum x_i}{n}\)。使用每個值,因此對異常值敏感。
- 中位數
- 數據按順序排序時的中間值。偶數個時,它是兩個中心值的平均值。基本上不受極端值的影響。
- 眾數
- 最常出現的值(或多個值)。數據集可能有一個眾數、多個眾數或如果每個值都唯一則沒有。
- 集中趨勢
- 總結數據集的中心或「典型」水平的單個值;平均值、中位數和眾數是三個常見的測量。
- 多峰
- 有多個眾數。兩個眾數稱為雙峰;多峰數據通常表示不同子組的混合。
- 範圍
- 最大值和最小值之間的差異,\(\text{範圍} = x_{\max} - x_{\min}\);總分散的簡單測量。
- 計數 (n)
- 數據集中的值的個數——計算平均值時使用的除數。
- 總和
- 通過將所有值相加獲得的總計,\(\sum x_i\);平均值的分子。
- 異常值
- 遠離其餘數據的值。異常值強烈影響平均值和範圍,但對中位數影響很小。
- 排序/有序數據
- 從最小到最大排列的值。排序是找到中位數並讀取範圍的最小值和最大值所必需的。
常見問題
如果我的資料沒有重複值怎麼辦?那就沒有眾數,計算機會顯示「無眾數」。
眾數可以不只一個嗎?可以。如果有兩個或更多數值都同時出現最多次,這些數值都會被列為眾數。
我該用哪一種平均?當資料分布對稱時,平均數最為適用;但若資料中有極端的離群值,中位數會更可靠,因為它不會被異常大或異常小的數值拉偏。