¿Qué es la distribución hipergeométrica?
La distribución hipergeométrica describe la probabilidad de obtener exactamente k éxitos en n extracciones realizadas sin reemplazo a partir de una población finita de tamaño N que contiene K éxitos en total. A diferencia de la distribución binomial (que supone reemplazo y una probabilidad constante), la hipergeométrica tiene en cuenta que cada extracción modifica la composición de la población restante.
Cómo usar esta calculadora
Introduce cuatro números enteros: el tamaño de la población N, el número de éxitos que hay en la población K, el tamaño de la muestra n y el número de éxitos observados k. La calculadora devuelve la probabilidad exacta \(P(X=k)\), las probabilidades acumuladas \(P(X \le k)\) y \(P(X \ge k)\), así como la media y la varianza de la distribución.
La fórmula, paso a paso
\(P(X=k)\) es igual al número de formas de elegir k éxitos entre los K disponibles, multiplicado por las formas de elegir los n−k elementos restantes entre los N−K fracasos, y todo ello dividido entre el número total de formas de elegir n elementos entre N.
$$P(X = \text{k}) = \dfrac{\dbinom{\text{K}}{\text{k}}\dbinom{\text{N}-\text{K}}{\text{n}-\text{k}}}{\dbinom{\text{N}}{\text{n}}}$$La media es \(\mu = \text{n}\,\dfrac{\text{K}}{\text{N}}\) y la varianza es \(\sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1}\), donde el último factor es la corrección por población finita.
$$\begin{gathered} \mu = \text{n}\,\dfrac{\text{K}}{\text{N}} \\[1em] \sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1} \end{gathered}$$
Ejemplo resuelto
Una baraja estándar de 52 cartas contiene K=4 ases. Extraemos n=5 cartas. La probabilidad de obtener exactamente k=2 ases es
$$\frac{\binom{4}{2}\binom{48}{3}}{\binom{52}{5}} = \frac{6 \cdot 17296}{2598960} \approx 0{,}039929$$El número esperado de ases es \(5 \cdot \dfrac{4}{52} \approx 0{,}3846\).
Preguntas frecuentes
¿Cuándo conviene usar la hipergeométrica en lugar de la binomial? Usa la hipergeométrica cuando muestrees sin reemplazo a partir de una población finita y pequeña; usa la binomial cuando las extracciones sean independientes o la población sea prácticamente infinita.
¿Qué significa \(P(X \ge k)\)? Es la probabilidad de obtener al menos k éxitos, muy útil para pruebas de cola, como el muestreo de aceptación en control de calidad.
¿Puede k ser mayor que K o que n? Si k supera el menor de los valores entre K y n, la probabilidad es 0, porque ese resultado es imposible.