¿Qué es una prueba Z para dos proporciones?
Una prueba Z para dos proporciones comprueba si la diferencia entre dos proporciones muestrales es estadísticamente significativa. Es la herramienta de referencia para los test A/B y para comparar tasas de conversión, tasas de respuesta, tasas de defectos o tasas de éxito entre dos grupos independientes. Bajo la hipótesis nula, las dos proporciones poblacionales son iguales, por lo que la prueba combina ambas muestras en una única estimación de la proporción común.
Cómo usar esta calculadora
Introduce el número de «éxitos» (por ejemplo, conversiones o respuestas positivas) y el tamaño total de la muestra de cada uno de los dos grupos. La calculadora devuelve el estadístico z, el valor p bilateral, las proporciones muestrales individuales, la proporción agrupada y el error estándar. Compara el valor p con tu nivel de significación (habitualmente 0,05): si es menor, la diferencia es estadísticamente significativa.
La fórmula explicada
Primero calcula cada proporción muestral: \(\hat{p}_1 = x_1/n_1\) y \(\hat{p}_2 = x_2/n_2\). Bajo la hipótesis nula, la proporción agrupada es \(\hat{p} = (x_1 + x_2)/(n_1 + n_2)\). El error estándar de la diferencia es \(SE = \sqrt{\,\hat{p}(1-\hat{p})(1/n_1 + 1/n_2)}\). Por último, \(z = (\hat{p}_1 - \hat{p}_2)/SE\). El valor p bilateral es \(2 \times P(Z > |z|)\) según la distribución normal estándar.
$$z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}$$
Ejemplo resuelto
Supongamos que el Grupo 1 tiene 45 éxitos de 100 (\(\hat{p}_1 = 0{,}45\)) y el Grupo 2 tiene 30 de 100 (\(\hat{p}_2 = 0{,}30\)). La proporción agrupada es \((45+30)/(100+100) = 0{,}375\). \(SE = \sqrt{0{,}375 \times 0{,}625 \times (0{,}01 + 0{,}01)} = \sqrt{0{,}0046875} \approx 0{,}06847\). Entonces \(z = (0{,}45 - 0{,}30)/0{,}06847 \approx 2{,}191\), lo que da un valor p bilateral \(\approx 0{,}0285\): significativo al nivel del 5 %.
Preguntas frecuentes
¿Cuándo debo usar una prueba agrupada o no agrupada? La versión agrupada (la que se usa aquí) asume proporciones iguales bajo la hipótesis nula y es la habitual para el contraste de hipótesis. El error estándar no agrupado suele emplearse para los intervalos de confianza.
¿Qué tamaño de muestra hace falta? La aproximación normal funciona bien cuando cada grupo tiene al menos unos 5 a 10 éxitos y fracasos esperados.
¿El valor p es unilateral o bilateral? Esta calculadora ofrece un valor p bilateral, que comprueba si las proporciones difieren en cualquiera de las dos direcciones.