MCPで接続 →

計算を入力してください

公式

広告

結果

Peak value of Probability mass f(x)
0.202331
at x = 5
Mean (n·p)5
Variance3.75
Std. deviation1.9365
0
1
2
3
4
5
6
7
8
9
10
11
12
x f(x)
0 0.003171212
1 0.021141413
2 0.066947808
3 0.133895615
4 0.189685455
5 0.202331152
6 0.168609293
7 0.112406195
8 0.060886689
9 0.027060751
10 0.009922275
11 0.00300675
12 0.000751688

二項分布とは

二項分布は、成功確率がつねに同じpである独立な試行(ベルヌーイ試行)をn回くり返したとき、成功回数xがどのように分布するかを表す確率分布です。たとえば「コインを20回投げて、ちょうど5回表が出る確率は?」といった問いに答えてくれます。これは純粋な数学であり、単位も国・地域による違いもなく、どこでもまったく同じように成り立ちます。

Bar chart of a binomial probability mass function
The binomial PMF gives the probability of x successes in n independent trials.

この計算機の使い方

まず計算する関数を選びます。ちょうどx回成功する確率である確率質量\(f(x)\)、下側累積確率\(P(X \le x)\)、上側累積確率\(Q(X \ge x)\)のいずれかです。次に試行回数n、1回あたりの成功確率p(0以上1以下)を入力し、最初の成功回数(xの初期値)、各行の刻み幅、生成する行数を指定します。選んだ関数を一覧表にまとめ、バーが隣り合って接する離散的なヒストグラム(棒グラフ)として描画します。

計算式の解説

確率質量関数は $$f(x,n,p) = \binom{n}{x}\, p^{\,x}\,(1-p)^{\,n-x}$$ で表され、ここで \(C(n,x) = \dfrac{n!}{x!\,(n-x)!}\) は二項係数です。下側累積確率\(P(x)\)は \(t = 0\)〜\(x\) にわたって \(f\) を合計したもの、上側累積確率\(Q(x)\)は \(t = x\)〜\(n\) にわたって \(f\) を合計したものです。nが大きいときに階乗がオーバーフローするのを防ぐため、本計算機では対数ガンマ関数を使って係数を求めます。すなわち $$\ln f = \ln\Gamma(n+1) - \ln\Gamma(x+1) - \ln\Gamma(n-x+1) + x\cdot\ln p + (n-x)\cdot\ln(1-p)$$ です。分布の平均は \(np\)、分散は \(np(1-p)\) となります。

広告
Three bar charts comparing PMF, lower cumulative, and upper cumulative
PMF f(x), lower cumulative P(X≤x), and upper cumulative Q(X≥x) compared.
Diagram showing the parts of the binomial formula
The formula multiplies the number of arrangements by the probability of each outcome.

計算例

\(n = 20\)、\(p = 0.25\) として、\(x = 0\)〜\(12\) で確率質量を求めると次のようになります。\(f(0) \approx 0.003171\)、\(f(1) \approx 0.021142\)、\(f(2) \approx 0.066948\)、\(f(3) \approx 0.133897\)、\(f(4) \approx 0.189691\)、\(f(5) \approx 0.202337\)。ピークは \(x = 5\) にあり、これは平均 $$np = 20 \times 0.25 = 5$$ と一致しています。まさに予想どおりの結果です。

定義と用語集

  • 試行(Trial): 固定された定義された結果集合を持つランダム実験の単一の繰り返し。
  • ベルヌーイ試行(Bernoulli trial): 正確に2つの相互に排他的な結果を持つ試行。慣例により「成功」と「失敗」とラベル付けされる。
  • 成功確率 \(p\): 単一の試行が成功する確率。ただし \(0 \le p \le 1\) とする。すべての試行で一定であると仮定される。
  • 試行回数 \(n\): 実験における独立したベルヌーイ試行の固定された回数。非負整数である。
  • 成功数 \(x\): \(n\) 回の試行における観測された成功数。\(x\) は \(0 \le x \le n\) を満たす整数である。
  • 確率質量関数(PMF) \(f(x)\): 正確に \(x\) 回の成功を得る確率を与える関数:\(f(x)=\binom{n}{x}p^{x}(1-p)^{n-x}\)
  • 下側累積 \(P(X\le x)\): 累積分布関数。最大で \(x\) 回の成功を得る確率:\(P(X\le x)=\sum_{k=0}^{x} f(k)\)
  • 上側累積 \(Q(X\ge x)\): 最低でも \(x\) 回の成功を得る確率:\(Q(X\ge x)=\sum_{k=x}^{n} f(k)=1-P(X\le x-1)\)
  • 二項係数 \(\binom{n}{x}\): \(n\) 回の試行から \(x\) 回の成功を選ぶ異なる方法の数。\(\binom{n}{x}=\dfrac{n!}{x!\,(n-x)!}\)
  • 平均 \(np\): 成功数の期待値。\(\mu = np\)
  • 分散 \(np(1-p)\): 成功数の分散。\(\sigma^{2}=np(1-p)\)。標準偏差は \(\sigma=\sqrt{np(1-p)}\)
広告

結果の解釈

3つの量は同じ実験に関する3つの異なる質問に答える:

  • \(f(x)\) — ちょうど \(x\): ちょうど \(x\) 回の成功を得る確率。「ちょうどk回」という質問に使用する。
  • \(P(X\le x)\) — 最大で \(x\): 成功数が \(x\) を超えない確率。「最大k回」「k回以下」「k+1回未満」という質問に使用する。
  • \(Q(X\ge x)\) — 最低でも \(x\): \(x\) 回以上の成功の確率。「最低でもk回」「k回以上」「k-1回より多く」という質問に使用する。

実際の質問を関数にマッピングする。 境界に注意して、表現を慎重に翻訳する:

  1. 「最低でも \(k\) 回」 \(\Rightarrow Q(X\ge k)\)
  2. 「\(k\) 回より多く」 \(\Rightarrow Q(X\ge k+1) = 1 - P(X\le k)\)
  3. 「最大で \(k\) 回」 \(\Rightarrow P(X\le k)\)
  4. 「\(k\) 回未満」 \(\Rightarrow P(X\le k-1)\)
  5. 「\(a\) 回から \(b\) 回まで(両端を含む)」 \(\Rightarrow P(X\le b) - P(X\le a-1)\)

\(P\)/\(Q\) の重複。 \(P(X\le x)\) と \(Q(X\ge x)\) の両方が項 \(f(x)\) を含むため、同じ \(x\) で補事象ではない。実際に \(P(X\le x) + Q(X\ge x) = 1 + f(x)\) なので、2つの累積尾部は正確に1つの点質量によって重複する。\(Q(X\ge x)\) の真の補事象は \(P(X\le x)\) ではなく \(P(X\le x-1)\) である。

正規分布による近似。 \(np\) と \(n(1-p)\) の両方が十分に大きい場合(一般的な経験則として各々が \(\ge 5\) であり、理想的には \(\ge 10\))、二項分布は平均 \(\mu = np\) および標準偏差 \(\sigma = \sqrt{np(1-p)}\) を持つ正規分布で適切に近似できる。離散的な計数を連続的な正規スケールに変換する場合、連続性補正を適用する(例えば \(x+0.5\) または \(x-0.5\) を使用する)。\(n\) が大きく \(p\) が小さい場合(\(np\) が適度に保たれる)、\(\lambda = np\) を持つポアソン分布はより正確な近似である。

よくある質問

なぜ \(P(x) + Q(x)\) は1にならないのですか? どちらの累積確率も点 \(t = x\) を含んでいるため、\(P(x) + Q(x) = 1 + f(x)\) となります。本計算機では、下側にも上側にもxを含めるというこの重複の取り決めを意図的に採用しています。

xが0〜nの範囲外のときはどうなりますか? 確率質量はその範囲外では0です。下側累積確率は \(x < 0\) で0、\(x \ge n\) で1にクランプされ、上側累積確率は \(x \le 0\) で1、\(x > n\) で0にクランプされます。

大きなnでも使えますか? はい。対数ガンマ関数による計算を行うため、通常の階乗ではオーバーフローしてしまうような大きなnでも、結果は安定して得られます。

最終更新: