2標本t検定とは?
2標本t検定は、独立した2つのグループの平均に統計的に意味のある差があるかどうかを調べる手法です。本ツールが採用しているのはウェルチのt検定で、2群の分散が等しいことを前提としないため、実務上のほとんどの場面で安心して使える「標準的な選択肢」といえます。2つの標本の平均・標準偏差・サンプルサイズを入力すると、t統計量、平均差の標準誤差、そしてWelch-Satterthwaite法による自由度を求められます。
使い方
2つの標本それぞれについて、平均・標準偏差・観測数(データの個数)を入力します。「計算」を押すとt統計量が表示されます。得られたtの絶対値を、表示された自由度を使ってt分布表の臨界値と比べるか、p値に変換して判断しましょう。これにより、「2つの平均は等しい」という帰無仮説を棄却すべきかどうかを検討できます。
計算式の解説
t統計量は、平均の差をその差の標準誤差で割ったものです:$$t = \dfrac{\bar{x}_1 - \bar{x}_2}{\sqrt{\dfrac{s_1^{2}}{n_1} + \dfrac{s_2^{2}}{n_2}}}$$。分母は、平均差にどの程度の標本変動(ばらつき)が見込まれるかを表します。\(|t|\)が大きいほど、観測された差がノイズに比べて大きいことを意味し、実際に効果が存在する可能性が高いと考えられます。
計算例
グループAが平均10.5、標準偏差2.5、\(n = 30\)、グループBが平均9.0、標準偏差3.0、\(n = 30\)だとします。分散の項はそれぞれ\(6.25/30 = 0.2083\)と\(9/30 = 0.3\)です。その合計は0.5083なので、標準誤差は\(\sqrt{0.5083} \approx 0.7130\)となります。平均差は1.5なので、$$t = 1.5 / 0.7130 \approx 2.104$$自由度はおよそ56と求められます。
よくある質問
なぜスチューデントのt検定ではなくウェルチのt検定なのですか? ウェルチのt検定は、2群の分散が異なる場合やサンプルサイズが不揃いな場合でも精度を保てます。一方、分散を併合(プール)するスチューデントの検定は、こうした状況では誤った結論を導くおそれがあります。
t値が2.1なら有意といえますか? 自由度約56・両側検定・有意水準0.05では臨界値はおよそ2.00です。したがって\(|t| = 2.1\)はわずかに基準を超えており、「ぎりぎり有意」といえる境界線上の値です。
2群が対応している(ペア)の場合は? その場合は対応のあるt検定(paired t-test)を使ってください。本ツールは2つの標本が独立していることを前提としています。