什麼是效果量?
效果量(effect size)用來衡量兩組之間差異的「大小」,而且不受樣本數影響。p 值只能告訴你差異是否達到統計顯著,效果量則進一步告訴你這個差異到底有多大、是否具備實務上的意義。在比較兩組平均數時,最常用的指標就是 Cohen's d——它是以合併標準差為單位所表示的標準化平均數差距。
如何使用本計算器
分別輸入兩組的平均數、標準差與樣本數。計算器會先求出合併標準差,再以兩組平均數的差除以它,得到 Cohen's d。系統還會自動判讀結果的強度等級,讓你一眼看出這個差異在實務上的重要性。
公式說明
合併標準差會把兩組的變異程度結合起來,並依各自的自由度(n − 1)加權:
$$s_p = \sqrt{\frac{(n_1 - 1)\,s_1^{2} + (n_2 - 1)\,s_2^{2}}{n_1 + n_2 - 2}}$$接著計算 Cohen's d:
$$d = \frac{\text{平均數}_1 - \text{平均數}_2}{s_p}$$依慣例,\(|d| \approx 0.2\) 為小效果、\(0.5\) 為中效果,\(0.8\) 以上則屬大效果。
實際範例
假設第 1 組的平均數為 100、標準差為 15、n = 30;第 2 組的平均數為 90、標準差為 15、n = 30。由於兩組標準差相同,合併標準差即為 15。Cohen's d \(=(100 − 90)/ 15 = 0.667\),屬於中到大的效果。
常見問題
多大的效果量才算「好」?這要看領域而定——在某些研究領域,d 為 0.3 就具有意義;在另一些領域,則可能需要 0.8 以上。建議與你所屬領域中常見的效果量相互比較。
d 值可以是負的嗎?可以。負的 d 只是代表第 2 組的平均數比較高;在判讀時,真正重要的是它的強度(絕對值)。
為什麼要用合併標準差,而不是單一組的標準差?合併標準差假設兩組具有相同的變異,能提供更穩定的標準化單位估計值。