此计算器的用途
负二项分布均值与方差计算器返回负二项分布的前两阶矩。在标准的“成功前的失败次数”参数化方式中,随机变量 X 表示在一系列独立的伯努利试验中,第 r 次成功之前出现的失败次数,其中每次试验以概率 p 成功。输入 r 和 p,该工具便会给出 X 的均值、方差和标准差。
工作原理
每次试验都是一次成功或失败的独立试验,成功概率恒为 p。你不断抽样,直到累积 r 次成功;而 X 就是这一过程中观察到的失败次数。由于 X 可以写成 r 个独立几何随机变量之和,每个变量都表示一次成功之前的失败次数,因此它的均值和方差恰好是单个几何项均值和方差的 r 倍。这样便得到只依赖于 r 和 p 的闭式表达式。
公式
X 的均值、方差和标准差为:
$$\mu = \frac{r(1-p)}{p}$$ $$\sigma^2 = \frac{r(1-p)}{p^2}$$ $$\sigma = \sqrt{r(1-p)}\,/\,p$$其中 r 是目标成功次数,p 是每次试验的成功概率,满足 0 < p <= 1。请注意,方差始终比均值大 1/p 倍,因此相对于泊松分布,负二项分布是过度离散的。
实例演算
假设你需要 r = 5 次成功,且每次试验以概率 p = 0.5 成功。第 5 次成功之前的平均失败次数为 5(1 - 0.5)/0.5 = 5。方差为 5(1 - 0.5)/0.5^2 = 2.5/0.25 = 10,因此标准差为 sqrt(10),约为 3.16。平均而言,你大约会遇到 5 次失败,且在该均值附近的典型波动约为 3 次失败。
常见问题
此计算器使用哪种负二项分布参数化方式? 它使用标准的“第 r 次成功之前的失败次数”约定,因此均值为 r(1-p)/p。如果你的教科书统计的是总试验次数而非失败次数,可在均值上加 r 以在两种约定之间转换。
r 必须是整数吗? 在经典的计数解释中,r 是正整数,但均值和方差公式对任意实数 r > 0 仍然成立,这正是广义(Pólya)负二项分布所对应的情形。
当 p 接近 1 时会发生什么? 当 p 接近 1 时,几乎每次试验都会成功,因此几乎没有失败,均值和方差都趋近于 0。而当 p 变小时,失败逐渐累积,两阶矩都会迅速增大。