Qu'est-ce que la borne supérieure ?
La borne supérieure est une limite statistique qui sert à détecter les valeurs aberrantes situées dans le haut d'une série de données. Toute valeur qui dépasse cette borne est signalée comme valeur aberrante potentielle et mérite un examen plus attentif. Elle s'inscrit dans la célèbre méthode de Tukey pour le repérage des données atypiques — la même approche qui trace les « moustaches » d'une boîte à moustaches.
Comment utiliser ce calculateur
Saisissez le premier quartile (Q1) et le troisième quartile (Q3) de votre série. Le calculateur détermine l'écart interquartile (\(\text{IQR} = \text{Q3} - \text{Q1}\)), le multiplie par 1,5 puis ajoute le résultat à Q3 pour obtenir la borne supérieure. Si vous ne connaissez pas encore vos quartiles, triez vos données dans l'ordre croissant, puis repérez la médiane de la moitié inférieure (Q1) et la médiane de la moitié supérieure (Q3).
La formule expliquée
La borne supérieure se définit ainsi :
$$\text{Borne supérieure} = \text{Q3} + 1{,}5 \times \left(\text{Q3} - \text{Q1}\right)$$La quantité \(\left(\text{Q3} - \text{Q1}\right)\) correspond à l'écart interquartile, une mesure de dispersion robuste qui ne tient pas compte des valeurs extrêmes. En multipliant l'IQR par 1,5, on obtient une marge de tolérance ; en la reportant au-dessus de Q3, on fixe le seuil au-delà duquel une observation est jugée anormalement élevée.
Exemple concret
Imaginons une série où \(\text{Q1} = 25\) et \(\text{Q3} = 75\). L'écart interquartile vaut \(75 - 25 = 50\). La borne supérieure est donc
$$75 + 1{,}5 \times 50 = 75 + 75 = 150$$Toute donnée supérieure à 150 serait alors considérée comme une valeur aberrante élevée potentielle.
Questions fréquentes
Pourquoi 1,5 ? Le facteur 1,5 est le multiplicateur standard introduit par John Tukey. Il offre un bon équilibre entre sensibilité et faux positifs pour des données à peu près normales. On utilise parfois un multiplicateur de 3,0 pour signaler les valeurs « extrêmes ».
Et la borne inférieure ? La limite correspondante vers le bas est \(\text{Q1} - 1{,}5 \times \text{IQR}\). Les valeurs inférieures à ce seuil sont des valeurs aberrantes du côté bas.
Une valeur au-dessus de la borne signifie-t-elle toujours une erreur ? Non. Elle ne fait que signaler le point à vérifier : il peut s'agir d'une observation authentique, mais extrême.