什么是效应量?
效应量(effect size)用于衡量两组之间差异的大小,且不受样本量影响。p 值只能告诉你差异是否“具有统计学显著性”,而效应量则告诉你这个差异究竟有多大、在实际中是否有意义。在比较两组均值时,最常用的指标就是 Cohen's d(科恩 d 值)——它把两组均值之差换算成以“合并标准差”为单位的标准化数值。
如何使用本计算器
分别填入两组数据的均值、标准差和样本量。计算器会先算出合并标准差,再用两组均值之差除以它,得到 Cohen's d。同时,它还会自动将结果归类为小、中或大效应,让你一眼就能判断其实际意义。
公式详解
合并标准差综合了两组各自的离散程度,并按各组的自由度(n − 1)进行加权:$$s_p = \sqrt{\frac{(n_1 - 1)\,s_1^{2} + (n_2 - 1)\,s_2^{2}}{n_1 + n_2 - 2}}$$。Cohen's d 则为 $$d = \frac{\text{Mean}_1 - \text{Mean}_2}{s_p}$$。按照惯例,\(|d| \approx 0.2\) 为小效应,\(0.5\) 为中等效应,\(0.8\) 及以上为大效应。
实例演示
假设第 1 组的均值为 100、标准差为 15、n = 30;第 2 组的均值为 90、标准差为 15、n = 30。由于两组标准差相等,合并标准差即为 15。于是 $$d = \frac{100 - 90}{15} = 0.667$$,属于中等偏大的效应。
常见问题
多大的效应量才算“好”?这取决于具体领域——在某些学科里,\(d = 0.3\) 就已经很有意义,而在另一些领域则需要 \(0.8\) 以上。建议与你所在领域常见的效应水平进行比较。
d 值可以为负吗?可以。负值只是表示第 2 组的均值更高;在解读时,真正重要的是它的绝对值大小。
为什么用合并标准差,而不是某一组的标准差?合并的前提是假设两组具有相同的总体方差,这样得到的标准化单位更稳定、更可靠。