什麼是 Cohen's d?
Cohen's d 是一種標準化的效應量指標,它以「合併標準差」為單位,呈現兩組平均數之間的差異有多大。p 值只能告訴你差異在統計上是否顯著,卻無法說明差異的實際大小;Cohen's d 則直接量化了這個差距,因此非常適合用來跨研究比較結果,或在統計檢定力分析中規劃所需的樣本數。
如何使用這個計算器
分別填入兩組資料的平均數、標準差與樣本數。計算器會先算出合併標準差,再將兩組平均數的差除以合併標準差,得到 Cohen's d,並依照 Cohen 提出的慣用標準判斷效果的大小級距。
公式說明
合併標準差會依各組的自由度為其變異數加權:
$$s_{pooled} = \sqrt{\frac{(n_1-1)s_1^{2} + (n_2-1)s_2^{2}}{n_1+n_2-2}}$$接著,
$$\text{Cohen's } d = \frac{\bar{x}_1 - \bar{x}_2}{s_{pooled}}$$依慣例,\(|d| \approx 0.2\) 為小效果、\(0.5\) 為中效果、\(0.8\) 以上則為大效果。
實際範例
假設第 1 組的平均數為 25、標準差為 12、樣本數為 40;第 2 組的平均數為 18、標準差為 9、樣本數為 30。合併變異數為
$$\frac{(39)(144) + (29)(81)}{68} = \frac{5616 + 2349}{68} = 117.1324$$因此 \(s_{pooled} \approx 10.8228\)。
$$\text{Cohen's } d = \frac{25 - 18}{10.8228} \approx 0.647$$屬於中等程度的效果。
常見問題
d 的正負號重要嗎?正負號只代表哪一組的平均數較高;真正反映效應量大小的是它的絕對值,因此實務上常以絕對值來報告。
為什麼要用合併標準差,而不是單一組的標準差?合併標準差整合了兩個樣本的資訊,能對共同的離散程度做出更穩定的估計;當兩組變異數大致相等時,這種做法尤其恰當。
如果兩組的樣本數不一樣,怎麼辦?沒問題——以自由度加權的計算方式會自動處理樣本數不相等的情況。