¿Qué es el F1 score?
El F1 score es una métrica única que combina la precisión y el recall en un solo número, lo que lo convierte en una de las formas más utilizadas para evaluar modelos de clasificación en machine learning, recuperación de información y estadística. Se trata de la media armónica de la precisión y el recall, de modo que premia a los clasificadores capaces de equilibrar ambas en lugar de destacar solo en una de ellas.
Cómo usar esta calculadora
Introduce tres valores de tu matriz de confusión: los verdaderos positivos (TP, los positivos predichos correctamente), los falsos positivos (FP, negativos que se predijeron erróneamente como positivos) y los falsos negativos (FN, positivos que se pasaron por alto). La calculadora te devuelve al instante la precisión, el recall y el F1 score resultante.
La fórmula explicada
Precisión \(= \text{TP} / (\text{TP} + \text{FP})\) mide cuántos de los positivos predichos eran correctos. Recall \(= \text{TP} / (\text{TP} + \text{FN})\) mide cuántos de los positivos reales se lograron detectar. El F1 score se calcula entonces como
$$F_1 = \frac{2 \cdot (\text{precisión} \cdot \text{recall})}{\text{precisión} + \text{recall}}$$Al tratarse de una media armónica, un valor bajo en la precisión o en el recall hace que el F1 score caiga de forma notable.
Ejemplo práctico
Supongamos que \(\text{TP} = 70\), \(\text{FP} = 30\) y \(\text{FN} = 10\). La precisión \(= 70 / 100 = 0{,}70\). El recall \(= 70 / 80 = 0{,}875\). El F1:
$$F_1 = \frac{2 \cdot (0{,}70 \cdot 0{,}875)}{0{,}70 + 0{,}875} = \frac{2 \cdot 0{,}6125}{1{,}575} \approx 0{,}7778$$es decir, alrededor del 77,78 %.
Preguntas frecuentes
¿Cuándo conviene usar el F1 en lugar de la exactitud (accuracy)? El F1 es preferible cuando las clases están desequilibradas, ya que la exactitud puede resultar engañosamente alta cuando una clase domina sobre las demás.
¿Qué se considera un buen F1 score? El F1 va de 0 a 1; cuanto más cerca de 1, mejor. Lo que se considera "bueno" depende de la tarea, pero los valores superiores a 0,8 suelen tomarse como sólidos.
¿Por qué es una media armónica? La media armónica penaliza el desequilibrio extremo entre la precisión y el recall más de lo que lo haría un promedio simple, garantizando así que ambas deban ser razonablemente altas.