什麼是樣本變異數?
樣本變異數(\(s^2\))用來衡量一組資料在平均數附近的分散程度,也就是各資料點與平均數距離平方後的平均值,但分母採用 n − 1 而非 n。之所以除以 n − 1(即貝索校正,Bessel correction),是因為當手上只有「樣本」而非完整母體資料時,這樣計算出的結果才會是母體真實變異數的不偏估計值。
計算器使用方式
將數字以逗號或空格分隔輸入即可,例如 4, 8, 15, 16, 23, 42。計算器會回傳樣本變異數、樣本標準差、平均數、資料筆數,以及離均差平方和,讓你能逐步核對每一個環節。
公式逐步解析
首先計算平均數 \(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\)。接著將每個數值減去平均數並把差值平方,再把這些平方值相加,得到 \(\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}\)。最後除以 n − 1 即為樣本變異數;再開根號就能得到樣本標準差 \(s\)。
$$s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2} \qquad \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$
實例演算
以資料集 4、8、15、16、23、42 為例:總和為 108,n = 6,因此平均數為 18。各項離均差平方分別是 196、100、9、4、25、576,相加得到 910。要特別留意:唯有在平均數剛好為整數 18 時,平方和才會是 910;若平均數並非整齊的 18,結果就會不同。以平均數 = 18 計算,\(\sum = 196+100+9+4+25+576 = 910\),變異數 \(= 910 / 5 = 182\)。在做除法之前,請務必先確認平均數是否正確。
常見問題
為什麼是除以 n − 1 而不是 n?若直接除以 n,會低估母體的分散程度;改用 n − 1 即可修正這項偏差。
什麼情況下該改用母體變異數?只有當你的資料涵蓋了母體中的「每一個」成員、而非僅是樣本時,才使用母體變異數(除以 n)。
變異數較大代表什麼?變異數越大,表示資料點相對於平均數的分布越分散。