二項分布の計算とは
このツールは、独立した試行を一定回数くり返したときの二項分布を計算します。成功回数 x、試行回数 n、1回あたりの成功確率 p を入力すると、ちょうど x 回成功する確率(確率質量)、下側累積確率、上側累積確率、そして平均(期待値)を返します。二項分布は、同じ「成功・失敗」の試行を成功確率を一定に保ったまま決まった回数くり返す場合に当てはまります。コインの表裏、ロット内の不良品の個数、当てずっぽうで正解するクイズの問題数などが典型例です。
使い方
3つの数値を入力します。成功回数 x と試行回数 n は整数で、\(0 \le x \le n\) かつ \(n \ge 1\) を満たす必要があります。確率 p は 0 から 1 の範囲で指定します。計算ボタンを押すと、4つの結果が一度に表示されます。二項分布は離散分布なので、主役となる値は確率質量(実際の確率そのもの)であり、確率密度ではない点に注意してください。
計算式の解説
確率質量は $$f(x,n,p) = \binom{n}{x} \cdot p^{x} \cdot (1-p)^{n-x}$$ で表されます。ここで \(C(n,x) = \dfrac{n!}{x!(n-x)!}\) は二項係数で、n 回の試行のうち x 回が成功する組み合わせの数を表します。下側累積確率 \(P(X \le x)\) は t = 0 から x までの \(f(t)\) の和、上側累積確率 \(Q(X \ge x)\) は t = x から n までの \(f(t)\) の和です。t = x の点が両方の和に含まれるため、\(P + Q - f(x) = 1\) が成り立ちます。平均は単純に \(\mu = n \cdot p\) です。係数は大きな n でも安定して計算できるよう、対数階乗を用いて求めています。
計算例
x = 9、n = 20、p = 0.4 の場合:\(C(20,9) = 167960\)、\(p^{9} = 0.000262144\)、\(0.6^{11} \approx 0.0036279706\) となります。したがって $$f = 167960 \times 0.000262144 \times 0.0036279706 \approx 0.15974$$ です。平均は \(20 \times 0.4 = 8\)。累積を求めると \(P(X \le 9) \approx 0.75534\)、\(Q(X \ge 9) \approx 0.40440\) となり、\(0.75534 + 0.40440 - 0.15974 \approx 1\) が成り立つことが確認できます。
定義と用語集
二項分布は、固定数の独立したはい/いいえ実験における成功の数をモデル化します。以下の用語はこの計算機全体に出現します。
- 試行:2つの可能な結果のいずれかをもたらす実験の1回の繰り返し(例えば、1回のコイン投げ)。
- 成功:数えている結果。あなたが定義したもの(表、不良部品、正解)。その補集合は「失敗」です。
- n(試行数):実行された独立した試行の総数。固定の正の整数である必要があります。
- x(成功数):確率を求めたい特定の成功数で、\(0 \le x \le n\)です。
- p(成功の確率):単一の試行が成功である確率。0から1の間の小数。
- q = 1 − p(失敗の確率):単一の試行が失敗である確率。
- 二項係数 \(\binom{n}{x}\):\(n\)個の試行のうち、どの\(x\)個が成功であるかを選ぶ異なる方法の数。\(\binom{n}{x}=\dfrac{n!}{x!\,(n-x)!}\)として計算されます。
- 確率質量関数(pmf)、\(f(x)\):正確に\(x\)個の成功の確率。\(f(x)=\binom{n}{x}p^{x}(1-p)^{n-x}\)。
- 下部累積確率、\(P(X \le x)\):最大で\(x\)個の成功の確率。0から\(x\)までのpmf値の合計。
- 上部累積確率、\(P(X \ge x)\):少なくとも\(x\)個の成功の確率。\(x\)から\(n\)までのpmf値の合計。
- 平均(期待値)、\(\mu = np\):多くの繰り返しで期待される成功の平均数。
- 分散、\(\sigma^{2}=np(1-p)\):平均周辺の分布の広がり。
- 標準偏差、\(\sigma=\sqrt{np(1-p)}\):平均からの成功数の典型的なずれ。\(x\)と同じ単位です。
結果の解釈
この計算機は3つの確率と平均を返します。質問の文言に合致するものを選んでください:
- pmf、\(f(x)=P(X=x)\) — 正確に\(x\)個の成功の可能性が欲しい場合に使用します。例えば「10回のコイン投げで正確に5回の表」。
- 下部累積確率、\(P(X \le x)\) — 最大で\(x\)個(「\(x\)個以下」)の場合に使用します。例えば「5問以下の正解」。
- 上部累積確率、\(P(X \ge x)\) — 少なくとも\(x\)個(「\(x\)個以上」)の場合に使用します。例えば「少なくとも1つの不良部品」。
累積値は\(x\)で重なることに注意してください:\(P(X \le x)+P(X \ge x)=1+f(x)\)。これは両方の範囲が\(x\)の値自体を含むためです。\(x\)より厳密に小さい場合は、\(P(X \le x-1)\)を使用します。\(x\)より厳密に大きい場合は、\(P(X \ge x+1)\)を使用します。
平均\(np\)は期待される成功数です。\(n\)試行の実験全体を何度も繰り返した場合の長期平均です。整数である必要はなく、期待値4.5は平均を単に表しています。
すべての確率は0から1の間の小数で報告されます(パーセンテージで表すには100を掛けます)。0に近い値はイベントがまれであることを意味し、1に近い場合はほぼ確実です。
これらの結果は4つの二項仮定が成り立つ場合にのみ有効です:
- 固定数の試行 \(n\)。結果を観察する前に決定されます。
- 試行ごとに2つの結果 — 各試行は成功または失敗です。
- すべての試行で成功の確率 \(p\)が一定です。
- 独立性 — 一方の試行の結果は他の試行に影響しません。
試行が独立していない、または\(p\)が試行間でずれている場合(例えば、小さい母集団から置換なしでサンプリング)、二項モデルは近似値でしかありません。
よくある質問
上側累積確率は x を含みますか? はい、含みます。ここでの \(Q(X \ge x)\) は t = x の点を含むため、\(P(X > x)\) ではなく \(P(X \ge x)\) を表します。
p=0 や p=1 のときはどうなりますか? \(0^{0}=1\) という規約を用いると、p=0 では \(f(0)=1\) でその他の確率はすべて 0、p=1 では \(f(n)=1\) となります。
なぜ「確率密度」ではなく「確率質量」なのですか? 確率密度は連続分布に対して用いる用語です。離散変数では各結果が実際の確率値そのものを持つため、「質量(mass)」が正しい表現になります。