什麼是合併標準差?
合併標準差(Pooled Standard Deviation,Sp)是把兩組樣本的標準差做加權平均,整合成單一的估計值,用來推估兩個母體共同的標準差。當你假設兩組獨立樣本來自「變異數相同」的母體時,就會用到它。合併估計值在雙樣本 t 檢定、Cohen's d 效果量,以及兩平均數差的信賴區間中,都扮演關鍵角色。
如何使用這個計算器
請輸入每組樣本的樣本數(\(n_1\) 與 \(n_2\))以及各自的標準差(\(s_1\) 與 \(s_2\))。計算器會回傳合併標準差、合併變異數(\(S_p^2\))以及自由度(\(n_1 + n_2 - 2\))。每組樣本至少要有兩筆觀測值,自由度才會維持為正數。
公式解析
合併變異數會依各組的自由度(\(n - 1\))對其變異數加權:
$$S_p^2 = \frac{(n_1 - 1)\,s_1^{2} + (n_2 - 1)\,s_2^{2}}{n_1 + n_2 - 2}$$
再開平方根,就得到合併標準差 \(S_p\)。樣本數較大的一組會對合併估計值貢獻較多,這也是為什麼要「加權」而非單純平均兩個變異數的原因。
範例試算
假設樣本 1 的 \(n_1 = 10\)、\(s_1 = 5\),樣本 2 的 \(n_2 = 12\)、\(s_2 = 6\)。則 \((10-1)\cdot 25 = 225\),\((12-1)\cdot 36 = 396\),兩者相加為 \(621\)。自由度為 \(10 + 12 - 2 = 20\),因此 \(S_p^2 = 621 / 20 = 31.05\),$$S_p = \sqrt{31.05} \approx 5.5722$$
常見問題
什麼時候該合併標準差?當你假設兩組的母體變異數相等時,就適合做合併。若兩組變異數差異很大,建議改用 Welch's t 檢定。
為什麼用 \(n - 1\) 而不是 \(n\)?使用 \(n - 1\)(即貝索校正,Bessel's correction)可以由樣本得到不偏的變異數估計值。
樣本的先後順序會影響結果嗎?不會。把兩組樣本互換,算出來的合併標準差完全相同。