此計算器的用途
負二項分布平均數與變異數計算器會回傳負二項分布的前兩階動差。在標準的「成功前的失敗次數」參數化方式中,隨機變數 X 表示在一連串獨立的伯努利試驗中,第 r 次成功之前出現的失敗次數,其中每次試驗以機率 p 成功。輸入 r 與 p,此工具便會給出 X 的平均數、變異數與標準差。
運作原理
每次試驗都是一次成功或失敗的獨立試驗,成功機率恆為 p。你持續抽樣,直到累積 r 次成功;而 X 就是這個過程中觀察到的失敗次數。由於 X 可以寫成 r 個獨立幾何隨機變數之和,每個變數都表示一次成功之前的失敗次數,因此它的平均數與變異數恰好是單一幾何項平均數與變異數的 r 倍。如此便得到只取決於 r 與 p 的封閉形式運算式。
公式
X 的平均數、變異數與標準差為:
$$\mu = \frac{r(1-p)}{p}$$ $$\sigma^2 = \frac{r(1-p)}{p^2}$$ $$\sigma = \sqrt{r(1-p)}\,/\,p$$其中 r 是目標成功次數,p 是每次試驗的成功機率,滿足 0 < p <= 1。請注意,變異數始終比平均數大 1/p 倍,因此相對於卜瓦松分布,負二項分布屬於過度離散。
範例演算
假設你需要 r = 5 次成功,且每次試驗以機率 p = 0.5 成功。第 5 次成功之前的平均失敗次數為 5(1 - 0.5)/0.5 = 5。變異數為 5(1 - 0.5)/0.5^2 = 2.5/0.25 = 10,因此標準差為 sqrt(10),約為 3.16。平均而言,你大約會遇到 5 次失敗,且在該平均值附近的典型波動約為 3 次失敗。
常見問題
此計算器使用哪一種負二項分布參數化方式? 它採用標準的「第 r 次成功之前的失敗次數」慣例,因此平均數為 r(1-p)/p。如果你的教科書統計的是總試驗次數而非失敗次數,可在平均數上加 r 以在兩種慣例之間轉換。
r 必須是整數嗎? 在傳統的計數解釋中,r 是正整數,但平均數與變異數公式對任意實數 r > 0 仍然成立,這正是廣義(Pólya)負二項分布所對應的情形。
當 p 接近 1 時會發生什麼? 當 p 接近 1 時,幾乎每次試驗都會成功,因此幾乎沒有失敗,平均數與變異數都趨近於 0。而當 p 變小時,失敗逐漸累積,兩階動差都會迅速增大。