什麼是二項分布百分位數計算器?
這個工具能反求二項分布 \(B(n, p)\) 的累積分布函數(CDF)。只要給定一個目標累積機率,它就會回傳達到該機率時所對應的數值 \(x\),也就是百分位數。由於二項分布是離散型分布,計算結果會在相鄰的整數值之間進行連續內插,因此 \(x\) 通常不會剛好是整數。
使用方式
首先選擇累積模式:下尾累積 P 會將你輸入的機率視為 \(P(X \le x)\);上尾累積 Q 則視為 \(P(X \ge x)\)。接著輸入目標累積機率(介於 0 與 1 之間)、試驗次數 \(n\),以及單次試驗的成功機率 \(p\)。計算器隨即會算出百分位數 \(x\)。
公式說明
機率質量函數為 $$f(x,n,p) = \binom{n}{x}\, p^{x}\,(1-p)^{\,n-x}.$$ 下尾累積分布為 $$P(x) = \sum_{t=0}^{x} f(t).$$ 本工具會計算每個整數 \(k\) 的 \(F(k)\),找出滿足 \(F(k-1) < P \le F(k)\) 的那個區間,再進行內插: $$x = (k-1) + \frac{P - F(k-1)}{F(k) - F(k-1)}.$$ 上尾模式則以互補的尾端機率 \(G(k) = P(X \ge k)\) 用相同方式計算。
實際範例
假設 \(n = 20\)、\(p = 0.25\)、下尾累積 \(P = 0.3\):由 CDF 可得 \(F(3) = 0.225156\) 與 \(F(4) = 0.414842\)。由於 \(0.3\) 落在這個區間內,所以 $$x = 3 + \frac{0.3 - 0.225156}{0.414842 - 0.225156} = 3 + 0.394672 = 3.3947.$$
定義和詞彙表
二項分佈 \(B(n,p)\) 模型化 \(n\) 次獨立試驗中的成功次數 \(X\),每次試驗的成功機率為 \(p\)。本計算器通過反演其累積分佈函數(CDF)來找到對應於所選累積機率的百分位點 \(x\)。
- 試驗次數 \(n\)
- 固定的獨立伯努利試驗次數。必須是正整數。在表單中,這是欄位 trials。
- 成功機率 \(p\)
- 單次試驗的成功機率,其中 \(0 \le p \le 1\)。同一值適用於每次試驗。在表單中,這是 successProbability。
- 機率質量函數(PMF)
- 恰好 \(k\) 次成功的機率:\(P(X=k)=\binom{n}{k}p^{k}(1-p)^{n-k}\),其中 \(k = 0,1,\dots,n\)。
- 累積分佈函數(CDF)
- PMF 至 \(k\) 的累積總和:\(F(k)=\sum_{t=0}^{k}\binom{n}{t}p^{t}(1-p)^{n-t}=P(X\le k)\)。這是一個非遞減階跃函數,在每個整數處跳躍。
- 下累積 \(P = P(X \le x)\)
- 成功次數最多為 \(x\) 的機率。當您選擇下累積模式(cumulativeMode = lower)時,計算器返回最小的 \(x\) 使得 \(F(x) \ge P\)。
- 上累積 \(Q = P(X \ge x)\)
- 成功次數至少為 \(x\) 的機率。因為支撐集是離散的,\(P(X\ge x)=1-F(x-1)\)。在上累積模式中,計算器返回最小的 \(x\) 使得 \(P(X\ge x)\le Q\)(等價地,最大的尾部其質量不超過 \(Q\))。
- 百分位點 \(x\)
- 在所要求的累積機率處的成功計數——分位數或反演 CDF 值。例如,第 90 百分位是最小的 \(x\) 使得 \(F(x)\ge 0.90\)。
- 階跃內的插值
- 因為二項分佈的 CDF 是階跃函數,精確的目標機率通常落在兩個整數值 \(k-1\) 和 \(k\) 之間。線性插值估計連續百分位為 \(x \approx (k-1) + \dfrac{P - F(k-1)}{F(k)-F(k-1)}\),其中 \(F(k)-F(k-1)=P(X=k)\)。整數百分位點本身始終為 \(k\);插值只是報告的小數精細化。
常見問題
為什麼 \(x\) 不是整數?二項分布的 CDF 是一個階梯函數。為了回傳有意義的百分位數,本工具會在包含你目標機率的那個階梯區間內進行線性內插。
當 \(P = 1\) 時會怎樣?此時涵蓋整個分布,因此 \(x\) 等於 \(n\);而當 \(P = 0\) 時,\(x\) 等於 0。
如果 \(p = 0\) 或 \(p = 1\) 呢?此時所有機率質量分別集中在 \(x = 0\) 或 \(x = n\),百分位數也會反映出這種退化(degenerate)的情形。