効果量とは?
効果量(エフェクトサイズ)とは、2群間の差の「大きさ」を、サンプルサイズに左右されずに測る指標です。p値は差が統計的に有意かどうかを教えてくれますが、その差が実際にどれほど大きく、実用的に意味があるのかまでは示してくれません。これを補うのが効果量です。2つの平均を比較する際にもっともよく使われるのがコーエンのd(Cohen's d)で、群間の平均差をプールされた標準偏差の単位で標準化した値を表します。
この計算ツールの使い方
2つの群それぞれについて、平均・標準偏差・サンプルサイズを入力してください。ツールがプールされた標準偏差を算出し、平均差をその値で割ってコーエンのdを求めます。さらに結果を自動で分類するので、その差が実用的にどの程度重要なのかを一目で読み取れます。
計算式の解説
プールされた標準偏差は、両群のばらつきを合わせたもので、それぞれを自由度(n − 1)で重み付けして計算します:$$s_p = \sqrt{\frac{(n_1 - 1)\,s_1^{2} + (n_2 - 1)\,s_2^{2}}{n_1 + n_2 - 2}}$$。コーエンのdはこれを用いて $$d = \frac{\text{平均}_1 - \text{平均}_2}{s_p}$$ で求めます。慣例として、\(|d| \approx 0.2\) は「小さい効果」、\(0.5\) は「中程度の効果」、\(0.8\) 以上は「大きい効果」とされています。
計算例
たとえば、群1が平均100・標準偏差15・n = 30、群2が平均90・標準偏差15・n = 30 だとします。両群の標準偏差が等しいため、プールされた標準偏差は15になります。コーエンのd = \((100 - 90) / 15 = 0.667\) となり、これは「中程度〜大きい効果」に相当します。
よくある質問
「良い」効果量とはどのくらい? これは分野によって異なります。ある領域では \(d = 0.3\) でも意味のある差とされますが、別の領域では \(0.8\) 以上が必要とされることもあります。自分の研究分野で一般的とされる効果量と比較することが大切です。
dがマイナスになることはある? あります。dが負の値になるのは、単に群2の平均のほうが高かったことを意味します。解釈においては符号ではなく、その大きさ(絶対値)が重要です。
なぜ片方の群の標準偏差ではなく、プールされた標準偏差を使うの? プールする方法は、両群が共通の分散を持つと仮定したうえで、標準化の単位をより安定して推定できるためです。