臨界t値とは?
臨界t値(t*)とは、スチューデントのt分布上で仮説検定の棄却域を定める境界点のことです。計算したt統計量がこの臨界値を超えた場合、帰無仮説を棄却します。臨界値は次の2つの要素によって決まります。1つは設定した有意水準(α)、もう1つは自由度(df)です。1標本検定の場合、自由度はサンプルサイズから1を引いた値になります。
計算ツールの使い方
まず有意水準を入力します。一般的には 0.05、0.01、0.10 がよく使われます。次に自由度を入力してください。続いて、検定が両側検定(どちらの方向への差も検出する)か、片側検定(一方向のみを検出する)かを選びます。すると臨界t値が表示されるので、これを自分のt統計量と比較します。
計算式
両側検定では、臨界値は確率 \(1 - \alpha/2\) における逆t分布として求められます。すなわち
$$t^{*} = t^{-1}\left(1 - \frac{\alpha}{2},\ \text{df}\right)$$です。片側検定では \(1 - \alpha\) を用います。t分布は左右対称であるため、両側検定の値は \(\pm t^{*}\) と表記されます。本ツールでは、Acklam の逆正規分布近似と Cornish–Fisher 展開を組み合わせて t 分位点を算出しています。
$$\begin{gathered} t_{\text{crit}} = z_{p} + \frac{g_1}{\nu} + \frac{g_2}{\nu^{2}} + \frac{g_3}{\nu^{3}} + \frac{g_4}{\nu^{4}} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} p &= 1 - \frac{\alpha}{2} \\ \nu &= \text{df} \\ z_{p} &= \Phi^{-1}(p) \end{aligned} \right. \end{gathered}$$計算例
\(\alpha = 0.05\)、\(\text{df} = 10\)、両側検定の場合を考えてみましょう。累積確率は
$$1 - \frac{0.05}{2} = 0.975$$となります。逆t分布を参照すると \(t^{*} \approx 2.228\) が得られます。したがって、t統計量が \(-2.228\) を下回るか、\(+2.228\) を上回った場合に帰無仮説を棄却することになります。
よくある質問
自由度はどの値を使えばよいですか? 1標本t検定では \(\text{df} = n - 1\) です。2標本検定では設計によって異なりますが、一般的には \(n_1 + n_2 - 2\) がよく用いられます。
片側検定と両側検定、どちらを使うべきですか? 仮説に方向性が明記されている場合(例:「〜より大きい」)を除いて、基本的には両側検定を使います。両側検定の方がより保守的(厳しめ)です。
なぜ自由度が大きくなると t* が 1.96 に近づくのですか? 自由度が増えるにつれて、t分布は標準正規分布に収束します。そのため、\(\alpha = 0.05\) における両側検定の臨界値は、標準正規分布の z 値である \(1.96\) に近づいていきます。