超幾何分布とは?
超幾何分布とは、K個の「成功」を含む大きさNの有限母集団から、非復元(戻さない)でn回抽出したときに、ちょうどk個の成功が得られる確率を表す分布です。復元抽出を前提とし確率が一定の二項分布とは異なり、超幾何分布では1回抽出するたびに残りの母集団の構成が変化する点を正しく反映します。
この計算ツールの使い方
4つの整数を入力するだけです。母集団の大きさN、母集団中の成功数K、標本サイズn、観測された成功数kを入力してください。ツールはちょうどk個の確率\(P(X=k)\)、累積確率\(P(X\le k)\)と\(P(X\ge k)\)、そして分布の平均と分散を返します。
計算式の解説
\(P(X=k)\)は、K個の成功からk個を選ぶ場合の数に、N−K個の失敗から残りn−k個を選ぶ場合の数を掛け、それをN個からn個を選ぶ全通り数で割った値です。
$$P(X = \text{k}) = \dfrac{\dbinom{\text{K}}{\text{k}}\dbinom{\text{N}-\text{K}}{\text{n}-\text{k}}}{\dbinom{\text{N}}{\text{n}}}$$平均はμ = n·K/N、分散はσ² = n·(K/N)·((N−K)/N)·((N−n)/(N−1)) で表され、最後の項は有限母集団修正(有限修正係数)と呼ばれます。
$$\begin{gathered} \mu = \text{n}\,\dfrac{\text{K}}{\text{N}} \\[1em] \sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1} \end{gathered}$$
具体例
52枚のトランプ1組にはエースがK=4枚あります。ここからn=5枚を引くとき、ちょうどk=2枚のエースが出る確率は、
$$\dfrac{\dbinom{4}{2}\dbinom{48}{3}}{\dbinom{52}{5}} = \dfrac{6\cdot 17296}{2598960} \approx 0.039929$$となります。エースの期待枚数は \(5\cdot 4/52 \approx 0.3846\) 枚です。
よくある質問(FAQ)
二項分布ではなく超幾何分布を使うべきなのはどんなとき? 小さな有限母集団から非復元で抽出する場合は超幾何分布を使います。一方、各抽出が独立している場合や、母集団が実質的に無限大とみなせる場合は二項分布を使います。
P(X≥k) は何を意味しますか? 成功が少なくともk個以上得られる確率を表します。品質管理の抜取検査(合格判定)など、片側(上側)の検定で役立ちます。
k は K や n より大きくできますか? kがKとnのうち小さい方を超える場合、その結果は起こり得ないため確率は0になります。