什么是超几何分布?
超几何分布用于描述这样一种情形:从总量为 \(N\)、其中包含 \(K\) 个"成功"个体的有限总体中,无放回地抽取 \(n\) 次,恰好抽到 \(k\) 个成功的概率。与二项分布不同——二项分布假设每次抽取后都放回,因此成功概率保持不变——超几何分布则考虑到每抽走一个个体,剩余总体的构成都会随之改变,所以后续每次抽取的概率都在动态变化。
如何使用本计算器
请输入四个整数:总体大小 \(N\)、总体中的成功个数 \(K\)、样本量 \(n\),以及观测到的成功个数 \(k\)。计算器会返回精确概率 \(P(X=k)\)、累积概率 \(P(X\le k)\) 与 \(P(X\ge k)\),并同时给出分布的均值和方差。
公式详解
\(P(X=k)\) 等于:从 \(K\) 个成功中选出 \(k\) 个的组合数,乘以从 \(N-K\) 个失败中选出剩余 \(n-k\) 个的组合数,再除以从 \(N\) 个个体中选出 \(n\) 个的总组合数。
$$P(X = k) = \dfrac{\dbinom{K}{k}\dbinom{N-K}{n-k}}{\dbinom{N}{n}}$$均值为 \(\mu = n\cdot K/N\),方差为 \(\sigma^{2} = n\cdot(K/N)\cdot((N-K)/N)\cdot((N-n)/(N-1))\),其中最后一项 \((N-n)/(N-1)\) 称为有限总体校正因子。
$$\begin{gathered} \mu = n\,\dfrac{K}{N} \\[1em] \sigma^{2} = n\,\dfrac{K}{N}\,\dfrac{N-K}{N}\,\dfrac{N-n}{N-1} \end{gathered}$$
实例演算
一副标准 52 张扑克牌中有 \(K=4\) 张 A。从中抽取 \(n=5\) 张牌,恰好抽到 \(k=2\) 张 A 的概率为
$$\frac{\dbinom{4}{2}\dbinom{48}{3}}{\dbinom{52}{5}} = \frac{6\cdot 17296}{2598960} \approx 0.039929$$而抽到 A 的期望张数为 \(5\cdot 4/52 \approx 0.3846\)。
常见问题
什么时候该用超几何分布而不是二项分布?当从规模较小的有限总体中进行无放回抽样时,使用超几何分布;当各次抽取相互独立、或总体可视为无限大时,则使用二项分布。
\(P(X\ge k)\) 是什么意思?它表示"至少"抽到 \(k\) 个成功的概率,常用于尾部检验,例如质量控制中的抽样验收(接收抽样)。
\(k\) 可以大于 \(K\) 或 \(n\) 吗?如果 \(k\) 超过了 \(K\) 与 \(n\) 中较小的那个值,概率即为 0,因为这种结果根本不可能发生。