Qu'est-ce que le score F1 ?
Le score F1 est une métrique unique qui combine la précision et le rappel en un seul chiffre. C'est l'une des façons les plus répandues d'évaluer les modèles de classification en apprentissage automatique, en recherche d'information et en statistique. Il correspond à la moyenne harmonique de la précision et du rappel : il récompense donc les classificateurs qui équilibrent les deux plutôt que ceux qui n'excellent que sur un seul critère.
Comment utiliser ce calculateur
Saisissez les trois effectifs issus de votre matrice de confusion : les vrais positifs (VP, les cas positifs correctement prédits), les faux positifs (FP, les cas négatifs prédits à tort comme positifs) et les faux négatifs (FN, les cas positifs qui ont été manqués). Le calculateur affiche aussitôt la précision, le rappel et le score F1 correspondant.
La formule expliquée
La précision = \( \frac{\text{VP}}{\text{VP} + \text{FP}} \) mesure la part de prédictions positives qui étaient correctes. Le rappel = \( \frac{\text{VP}}{\text{VP} + \text{FN}} \) mesure la part des cas réellement positifs qui ont été détectés. Le score F1 vaut alors
$$ F_1 = \frac{2 \cdot (\text{précision} \cdot \text{rappel})}{\text{précision} + \text{rappel}} $$Comme il s'agit d'une moyenne harmonique, une valeur faible de la précision ou du rappel fait chuter fortement le score F1.
Exemple concret
Supposons \( \text{VP} = 70 \), \( \text{FP} = 30 \), \( \text{FN} = 10 \). La précision = \( \frac{70}{100} = 0{,}70 \). Le rappel = \( \frac{70}{80} = 0{,}875 \). Le F1 =
$$ F_1 = \frac{2 \cdot (0{,}70 \cdot 0{,}875)}{0{,}70 + 0{,}875} = \frac{2 \cdot 0{,}6125}{1{,}575} \approx 0{,}7778 $$soit environ 77,78 %.
FAQ
Quand vaut-il mieux utiliser le F1 plutôt que l'exactitude (accuracy) ? Le F1 est préférable lorsque les classes sont déséquilibrées, car l'exactitude peut être trompeusement élevée quand une classe domine largement.
Qu'est-ce qu'un bon score F1 ? Le F1 varie de 0 à 1 ; plus il s'approche de 1, mieux c'est. Ce que l'on considère comme « bon » dépend de la tâche, mais les valeurs supérieures à 0,8 sont souvent jugées solides.
Pourquoi une moyenne harmonique ? La moyenne harmonique pénalise plus fortement un déséquilibre marqué entre précision et rappel qu'une simple moyenne arithmétique : elle impose que les deux soient raisonnablement élevés.