フィッシャーの正確確率検定とは?
フィッシャーの正確確率検定(Fisher's Exact Test)は、2×2分割表における2つのカテゴリ変数に関連があるかどうかを調べる手法です。カイ二乗検定が近似的なp値を求めるのに対し、本検定は「正確な」p値を計算します。そのため、サンプルサイズが小さい場合や、各セルの期待度数が少ない表でも信頼性の高い結果が得られます。生物学・医学・社会科学などの分野で広く用いられています。
この計算ツールの使い方
2×2表の4つのセルの度数を入力してください。aとbが1行目、cとdが2行目を構成します。本ツールは、観測された表が得られる超幾何分布に基づく正確な確率と、両側p値を計算します。両側p値は、行と列の合計(周辺度数)が同じ表のうち、観測された表と同程度かそれ以下の確率しか持たないすべての表の確率を合計したものです。
計算式の解説
周辺度数を固定したとき、ある特定の表が得られる確率は超幾何分布に従います。 $$p = \dfrac{(a+b)!\,(c+d)!\,(a+c)!\,(b+d)!}{n!\;a!\,b!\,c!\,d!}$$ ここで \(n = a + b + c + d\) です。両側p値は、周辺度数が同じ表のうち、観測された確率以下となるすべての表についてpを合計して求めます。 $$P_{\text{two-sided}} = \sum_{\,p_i \le p_{\text{obs}}} p_i$$
計算例
\(a = 8\)、\(b = 2\)、\(c = 1\)、\(d = 5\)(\(n = 16\))の表を例にとります。この表そのものが得られる確率は約0.01865です。これと同程度かそれ以下の確率を持つすべての表を合計すると、両側p値は約0.0349となります。これは有意水準0.05のもとで統計的に有意な関連があることを示唆しています。
よくある質問
カイ二乗検定ではなくフィッシャーの検定を使うべきなのはどんなとき? サンプルサイズが小さい場合や、いずれかのセルの期待度数が5未満の場合に使用します。こうした状況ではカイ二乗近似の信頼性が低くなるためです。
両側p値は何を意味しますか? 変数間に関連がないと仮定したとき、観測された表と同等以上に極端な表が(どちらの方向でも)得られる確率を表します。
もっと大きな表にも対応できますか? 本ツールは2×2表専用です。より大きな分割表には、一般化された正確確率検定が必要になります。