Qu'est-ce que la borne inférieure ?
La borne inférieure est un seuil statistique qui sert à détecter les valeurs aberrantes situées dans le bas d'un jeu de données. Toute valeur qui passe sous cette borne est signalée comme valeur aberrante potentielle. Elle s'inscrit dans la règle classique du 1,5 × IQR popularisée par John Tukey : c'est le même calcul qui trace les moustaches et identifie les points extrêmes dans une boîte à moustaches.
Comment utiliser ce calculateur
Saisissez le premier quartile (Q1) et le troisième quartile (Q3) de votre série de données. Le calculateur détermine l'écart interquartile (\(\text{IQR} = \text{Q3} - \text{Q1}\)), le multiplie par 1,5, puis soustrait le résultat de Q1 pour obtenir la borne inférieure. Utilisez-le avec la borne supérieure afin d'encadrer la plage des valeurs « normales ».
La formule expliquée
La formule est $$\text{Borne inférieure} = \text{Q1} - 1{,}5 \times \left( \text{Q3} - \text{Q1} \right)$$ Calculez d'abord l'IQR en soustrayant Q1 de Q3. Le coefficient 1,5 règle la sévérité de la détection : un coefficient plus élevé (3,0 par exemple) ne signale que les valeurs extrêmes, tandis que 1,5 reste le choix conventionnel pour repérer les valeurs aberrantes « modérées ».
Exemple concret
Imaginons un jeu de données où \(\text{Q1} = 25\) et \(\text{Q3} = 75\). L'IQR vaut \(75 - 25 = 50\). Multiplié par 1,5, on obtient 75, que l'on soustrait à Q1 : $$25 - 75 = -50$$ Toute observation inférieure à −50 est une valeur aberrante basse potentielle.
FAQ
Que signifie une borne inférieure négative ? Cela indique simplement qu'aucune valeur basse réaliste ne sera signalée comme aberrante : le seuil se situe en dessous de la plage de vos données. C'est fréquent lorsque la distribution est symétrique ou étalée vers la droite.
Comment obtenir Q1 et Q3 ? Triez vos données, puis trouvez la médiane de la moitié inférieure (Q1) et la médiane de la moitié supérieure (Q3). De nombreux tableurs proposent une fonction QUARTILE pour le faire automatiquement.
Pourquoi 1,5 fois l'IQR ? C'est une convention largement adoptée qui équilibre sensibilité et faux positifs pour des données à peu près normales. Utilisez \(3{,}0 \times \text{IQR}\) si vous souhaitez ne capter que les valeurs vraiment extrêmes.