什麼是雙樣本 t 檢定?
雙樣本 t 檢定用來判斷兩組獨立資料的平均數是否有顯著差異。本計算器採用 Welch t 檢定,不需要假設兩組變異數相等,因此在絕大多數實際情境中都是最穩妥的預設選擇。只要輸入兩組樣本的平均數、標準差與樣本數,即可算出 t 統計量、差異的標準誤,以及 Welch-Satterthwaite 自由度。
使用方法
分別填入兩組樣本各自的平均數、標準差與觀測值個數,按下計算就能得到 t 統計量。接著可將 t 的絕對值與 t 分配表的臨界值(依照計算出的自由度查表)比較,或換算成 p 值,藉此判斷是否拒絕「兩組平均數相等」的虛無假設。
公式說明
t 統計量等於兩組平均數的差,除以該差異的標準誤:$$t = \dfrac{\text{x̄}_1 - \text{x̄}_2}{\sqrt{\dfrac{\text{s}_1^{2}}{\text{n}_1} + \dfrac{\text{s}_2^{2}}{\text{n}_2}}}$$。分母衡量的是我們預期差異會出現多大的抽樣變動。\(|t|\) 越大,代表觀測到的差距相對於雜訊越明顯,越可能存在真實的效應。
實際範例
假設 A 組的平均數為 10.5、標準差 2.5、n = 30;B 組的平均數為 9.0、標準差 3.0、n = 30。兩個變異數項分別為 \(6.25/30 = 0.2083\) 與 \(9/30 = 0.3\),相加得 \(0.5083\),因此標準誤為 \(\sqrt{0.5083} \approx 0.7130\)。兩組差異為 \(1.5\),故 $$t = \frac{1.5}{0.7130} \approx 2.104$$,自由度約為 56。
常見問題
為什麼用 Welch 檢定,而不是 Student 檢定?即使兩組的變異數不同、或樣本數不一致,Welch 檢定依然能維持準確;而 Student 的合併變異數檢定在這些情況下可能會誤導結論。
t 值 2.1 算顯著嗎?在雙尾、顯著水準 0.05、自由度約 56 的條件下,臨界值約為 2.00,因此 \(|t| = 2.1\) 剛好跨過門檻,屬於邊際顯著。
如果兩組資料是成對的怎麼辦?那就改用成對 t 檢定;本計算器假設兩組樣本彼此獨立。