Что такое биномиальное распределение?
Биномиальное распределение описывает число успехов x в фиксированном количестве независимых испытаний n, где каждое испытание заканчивается успехом с одной и той же вероятностью p (испытание Бернулли). Оно отвечает на вопросы вроде «какова вероятность выпадения ровно 5 «орлов» при 20 подбрасываниях монеты?». Это чистая математика, которая работает одинаково в любой точке мира — без единиц измерения и без привязки к какой-либо стране.
Как пользоваться калькулятором
Сначала выберите, какую функцию нужно вычислить: вероятность \(f(x)\) (шанс получить ровно x успехов), нижнюю кумулятивную вероятность \(P(X \le x)\) или верхнюю кумулятивную \(Q(X \ge x)\). Затем укажите число испытаний n, вероятность успеха в одном испытании p (от 0 до 1), а после этого задайте начальное число успехов (стартовое значение x), шаг между строками и количество строк, которые нужно сгенерировать. Калькулятор построит таблицу и график выбранной функции в виде дискретной гистограммы со столбцами, примыкающими друг к другу.
Разбор формулы
Функция вероятности (PMF) имеет вид
$$f(x,n,p) = \binom{n}{x}\, p^{\,x}\,(1-p)^{\,n-x}$$где \(\binom{n}{x} = \dfrac{n!}{x!\,(n-x)!}\) — биномиальный коэффициент. Нижняя кумулятивная вероятность P(x) — это сумма f по t = 0..x, а верхняя кумулятивная Q(x) — сумма f по t = x..n.
$$P(X \le x) = \sum_{t=0}^{x} \binom{n}{t}\, p^{\,t}\,(1-p)^{\,n-t}$$$$P(X \ge x) = \sum_{t=x}^{n} \binom{n}{t}\, p^{\,t}\,(1-p)^{\,n-t}$$Чтобы избежать переполнения при вычислении факториалов для больших n, калькулятор находит коэффициент через логарифм гамма-функции:
$$\ln f = \ln\Gamma(n+1) - \ln\Gamma(x+1) - \ln\Gamma(n-x+1) + x\cdot\ln p + (n-x)\cdot\ln(1-p)$$Математическое ожидание распределения равно \(np\), а дисперсия — \(np(1-p)\).
Пример расчёта
Для n = 20, p = 0,25 вычислим PMF при x = 0..12: \(f(0) \approx 0{,}003171\), \(f(1) \approx 0{,}021142\), \(f(2) \approx 0{,}066948\), \(f(3) \approx 0{,}133897\), \(f(4) \approx 0{,}189691\) и \(f(5) \approx 0{,}202337\). Максимум приходится на x = 5, что в точности совпадает с математическим ожиданием
$$np = 20 \times 0{,}25 = 5$$— ровно так, как и должно быть.
Частые вопросы
Почему P(x) + Q(x) не равно 1? Обе кумулятивные вероятности включают точку t = x, поэтому \(P(x) + Q(x) = 1 + f(x)\). Такое перекрытие (и нижняя, и верхняя включают сам x) использовано здесь намеренно.
Что будет, если x выходит за пределы 0..n? Тогда PMF равна 0; нижняя кумулятивная вероятность ограничивается значением 0 (при \(x < 0\)) или 1 (при \(x \ge n\)), а верхняя — значением 1 (при \(x \le 0\)) или 0 (при \(x > n\)).
Можно ли использовать большие n? Да. Вычисление через логарифм гамма-функции сохраняет устойчивость результата при больших n, когда прямой расчёт факториалов привёл бы к переполнению.
Определения и глоссарий
- Испытание: Одно повторение случайного эксперимента с фиксированным, определённым набором результатов.
- Испытание Бернулли: Испытание с ровно двумя взаимно исключающими результатами, обычно называемыми «успех» и «неудача».
- Вероятность успеха \(p\): Вероятность того, что одно испытание завершится успехом, где \(0 \le p \le 1\). Предполагается, что эта вероятность постоянна для всех испытаний.
- Количество испытаний \(n\): Фиксированное число независимых испытаний Бернулли в эксперименте, неотрицательное целое число.
- Успехи \(x\): Наблюдаемое число успехов среди \(n\) испытаний; \(x\) — целое число с \(0 \le x \le n\).
- ФМВ \(f(x)\): Функция массы вероятности, дающая вероятность ровно \(x\) успехов: \(f(x)=\binom{n}{x}p^{x}(1-p)^{n-x}\).
- Нижняя кумулятивная \(P(X\le x)\): Функция распределения вероятностей, вероятность не более \(x\) успехов: \(P(X\le x)=\sum_{k=0}^{x} f(k)\).
- Верхняя кумулятивная \(Q(X\ge x)\): Вероятность по крайней мере \(x\) успехов: \(Q(X\ge x)=\sum_{k=x}^{n} f(k)=1-P(X\le x-1)\).
- Биномиальный коэффициент \(\binom{n}{x}\): Количество различных способов выбрать \(x\) успехов из \(n\) испытаний, \(\binom{n}{x}=\dfrac{n!}{x!\,(n-x)!}\).
- Среднее \(np\): Ожидаемое число успехов, \(\mu = np\).
- Дисперсия \(np(1-p)\): Дисперсия количества успехов, \(\sigma^{2}=np(1-p)\); стандартное отклонение — \(\sigma=\sqrt{np(1-p)}\).
Интерпретация вашего результата
Эти три величины отвечают на три различных вопроса об одном и том же эксперименте:
- \(f(x)\) — ровно \(x\): вероятность получить ровно \(x\) успехов и никакое другое число. Используйте для вопросов «ровно k».
- \(P(X\le x)\) — не более \(x\): вероятность того, что число успехов не превышает \(x\). Используйте для вопросов «не более k», «не больше k» или «меньше чем k+1».
- \(Q(X\ge x)\) — по крайней мере \(x\): вероятность \(x\) или более успехов. Используйте для вопросов «по крайней мере k», «k или больше» или «больше чем k−1».
Сопоставление реального вопроса с функцией. Переводите формулировку внимательно, следя за границей:
- «По крайней мере \(k\)» \(\Rightarrow Q(X\ge k)\).
- «Больше чем \(k\)» \(\Rightarrow Q(X\ge k+1) = 1 - P(X\le k)\).
- «Не более \(k\)» \(\Rightarrow P(X\le k)\).
- «Меньше чем \(k\)» \(\Rightarrow P(X\le k-1)\).
- «Между \(a\) и \(b\) включительно» \(\Rightarrow P(X\le b) - P(X\le a-1)\).
Перекрытие \(P\)/\(Q\). Поскольку оба \(P(X\le x)\) и \(Q(X\ge x)\) включают член \(f(x)\), они не дополняют друг друга при одном и том же \(x\). Фактически \(P(X\le x) + Q(X\ge x) = 1 + f(x)\), поэтому два кумулятивных хвоста перекрываются ровно на одну точку массы. Истинное дополнение \(Q(X\ge x)\) — это \(P(X\le x-1)\), а не \(P(X\le x)\).
Нормальное приближение. Когда оба \(np\) и \(n(1-p)\) достаточно велики (общее эмпирическое правило — каждый \(\ge 5\), и в идеале \(\ge 10\)), биномиальное распределение хорошо аппроксимируется нормальным распределением со средним \(\mu = np\) и стандартным отклонением \(\sigma = \sqrt{np(1-p)}\). Применяйте коррекцию непрерывности (например, используйте \(x+0.5\) или \(x-0.5\)) при переводе дискретного отсчёта на непрерывную нормальную шкалу. При большом \(n\) с малым \(p\) (так чтобы \(np\) оставалось умеренным), распределение Пуассона с параметром \(\lambda = np\) — это более точное приближение.