Что такое гипергеометрическое распределение?
Гипергеометрическое распределение показывает вероятность извлечь ровно k «успехов» за n извлечений, выполняемых без возвращения из конечной совокупности объёма N, в которой всего содержится K успехов. В отличие от биномиального распределения (где предполагается возвращение и постоянная вероятность), гипергеометрическое учитывает, что каждое извлечение меняет состав оставшейся совокупности.
Как пользоваться калькулятором
Введите четыре целых числа: объём совокупности N, число успехов в совокупности K, размер выборки n и число наблюдаемых успехов k. Калькулятор выдаст точную вероятность \(P(X=k)\), кумулятивные вероятности \(P(X \le k)\) и \(P(X \ge k)\), а также среднее и дисперсию распределения.
Разбор формулы
\(P(X=k)\) равна числу способов выбрать k успехов из K, умноженному на число способов выбрать оставшиеся n−k объектов из N−K неудач, и поделённому на общее число способов выбрать n объектов из N.
$$P(X = \text{k}) = \dfrac{\dbinom{\text{K}}{\text{k}}\dbinom{\text{N}-\text{K}}{\text{n}-\text{k}}}{\dbinom{\text{N}}{\text{n}}}$$Среднее равно \(\mu = \text{n}\,\dfrac{\text{K}}{\text{N}}\), а дисперсия — \(\sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1}\), где последний множитель — это поправка на конечность совокупности.
$$\begin{gathered} \mu = \text{n}\,\dfrac{\text{K}}{\text{N}} \\[1em] \sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1} \end{gathered}$$
Пример с разбором
В стандартной колоде из 52 карт содержится K=4 туза. Вытягиваем n=5 карт. Вероятность получить ровно k=2 туза равна $$\frac{C(4,2)\cdot C(48,3)}{C(52,5)} = \frac{6\cdot 17296}{2598960} \approx 0{,}039929.$$ Ожидаемое число тузов составляет \(5\cdot 4/52 \approx 0{,}3846\).
Частые вопросы
Когда применять гипергеометрическое распределение вместо биномиального? Используйте гипергеометрическое при выборке без возвращения из небольшой конечной совокупности; биномиальное подойдёт, когда извлечения независимы или совокупность фактически бесконечна.
Что означает \(P(X \ge k)\)? Это вероятность получить не менее k успехов — она полезна для проверок «в хвосте» распределения, например при приёмочном контроле качества.
Может ли k быть больше K или n? Если k превышает меньшее из чисел K и n, вероятность равна 0, поскольку такой исход невозможен.