¿Qué es una calculadora de valores atípicos?
Un valor atípico (u outlier) es un dato que se aleja notablemente del resto del conjunto. Esta calculadora utiliza el conocido método del rango intercuartílico (IQR), también llamado vallas de Tukey, para señalar valores anormalmente altos o bajos. Solo tienes que introducir tus números y obtendrás los cuartiles, el IQR, las vallas inferior y superior y la lista de valores atípicos detectados.
Cómo usarla
Escribe tu conjunto de datos en el cuadro, separando los valores con comas o espacios (por ejemplo, 4, 5, 6, 7, 8, 100). La calculadora ordena los valores, calcula el primer cuartil (Q1), el tercer cuartil (Q3) y el rango intercuartílico, y luego marca como atípico cualquier valor que quede a más de 1,5 veces el IQR por fuera de los cuartiles.
La fórmula explicada
El rango intercuartílico es \(\text{IQR} = Q_3 - Q_1\). Las vallas se calculan así: \(\text{Inferior} = Q_1 - 1{,}5\cdot\text{IQR}\) y \(\text{Superior} = Q_3 + 1{,}5\cdot\text{IQR}\). Cualquier valor por debajo de la valla inferior o por encima de la superior se considera atípico. El factor 1,5 es la convención estándar; algunos analistas emplean 3,0 para detectar valores atípicos «extremos».
$$\begin{gathered} \text{Outlier if} \quad x < \text{LB} \quad \text{or} \quad x > \text{UB} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} \text{IQR} &= Q_3 - Q_1 \\ \text{LB} &= Q_1 - 1.5\,\text{IQR} \\ \text{UB} &= Q_3 + 1.5\,\text{IQR} \\ x &\in \text{Data set} \end{aligned} \right. \end{gathered}$$
Ejemplo resuelto
Para 10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\)), la mediana divide los datos en una mitad inferior {10, 12, 14, 15} y una mitad superior {18, 20, 22, 25}. \(Q_1 = (12+14)/2 = 13\) y \(Q_3 = (20+22)/2 = 21\)… aquí \(Q_3 = 23{,}5\) para el conjunto alternativo. El \(\text{IQR} = 10{,}5\), por lo que la valla inferior es \(-2{,}75\) y la valla superior es \(39{,}25\). El valor 90 supera 39,25, así que se marca como un único valor atípico.
Preguntas frecuentes
¿Qué método de cuartiles se utiliza? El método de la mediana exclusiva: cuando n es impar, la mediana general se excluye de ambas mitades.
¿Por qué 1,5 veces el IQR? Es el umbral convencional propuesto por John Tukey; abarca aproximadamente las colas que quedan más allá de la dispersión habitual de los datos.
¿Pueden ser legítimos los valores atípicos? Sí. Un valor atípico es solo estadísticamente inusual, no necesariamente un error. Investígalo siempre antes de eliminarlo.