Connectez-vous via MCP →

Entrez le calcul

Formule

Publicité

Résultats

Valeurs aberrantes détectées
90.0
1 outlier(s) in 9 values
Premier quartile (Q1) 13
Troisième quartile (Q3) 23,5
Écart interquartile (IQR) 10,5
Borne basse (Q1 − 1,5·IQR) -2,75
Borne haute (Q3 + 1,5·IQR) 39,25

Qu'est-ce qu'un calculateur de valeurs aberrantes ?

Une valeur aberrante (ou « outlier ») est un point de données qui s'écarte nettement du reste de votre jeu de données. Ce calculateur s'appuie sur la fameuse méthode de l'écart interquartile (IQR), aussi appelée méthode des clôtures de Tukey, pour signaler les valeurs anormalement hautes ou basses. Il vous suffit de saisir vos nombres : l'outil renvoie les quartiles, l'IQR, les bornes basse et haute, ainsi que la liste des valeurs aberrantes détectées.

Comment l'utiliser

Saisissez votre jeu de données dans le champ prévu, en séparant les nombres par des virgules ou des espaces (par exemple 4, 5, 6, 7, 8, 100). Le calculateur trie les valeurs, calcule le premier quartile (Q1), le troisième quartile (Q3) et l'écart interquartile, puis signale comme aberrante toute valeur située à plus de 1,5 IQR au-delà des quartiles.

La formule expliquée

L'écart interquartile se calcule ainsi : \(\text{IQR} = Q_3 - Q_1\). Les clôtures sont définies par \(\text{Borne basse} = Q_1 - 1{,}5\cdot\text{IQR}\) et \(\text{Borne haute} = Q_3 + 1{,}5\cdot\text{IQR}\). Toute valeur inférieure à la borne basse ou supérieure à la borne haute est considérée comme aberrante. Le coefficient 1,5 est la convention standard ; certains analystes retiennent plutôt 3,0 pour identifier les valeurs aberrantes « extrêmes ».

$$\begin{gathered} \text{Valeur aberrante si} \quad x < \text{LB} \quad \text{ou} \quad x > \text{UB} \\[1.5em] \text{où}\quad \left\{ \begin{aligned} \text{IQR} &= Q_3 - Q_1 \\ \text{LB} &= Q_1 - 1{,}5\,\text{IQR} \\ \text{UB} &= Q_3 + 1{,}5\,\text{IQR} \\ x &\in \text{Jeu de données} \end{aligned} \right. \end{gathered}$$
Publicité
Boîte à moustaches sur une droite numérique montrant Q1, Q3, IQR, les bornes inférieure et supérieure, et des points aberrants au-delà des bornes
Bornes de Tukey : les points au-delà de \(Q_1 - 1{,}5\cdot\text{IQR}\) ou \(Q_3 + 1{,}5\cdot\text{IQR}\) sont signalés comme valeurs aberrantes.

Exemple concret

Pour la série 10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\)), la médiane divise les données en une moitié inférieure {10, 12, 14, 15} et une moitié supérieure {18, 20, 22, 25}. On obtient \(Q_1 = (12+14)/2 = 13\) et \(Q_3 = (20+22)/2 = 21\)… ici \(Q_3 = 23{,}5\) pour la série alternative. L'IQR vaut \(10{,}5\), ce qui donne une borne basse de \(-2{,}75\) et une borne haute de \(39{,}25\). La valeur 90 dépasse \(39{,}25\) : elle est donc signalée comme unique valeur aberrante.

Foire aux questions

Quelle méthode de calcul des quartiles est utilisée ? La méthode de la médiane exclusive : lorsque n est impair, la médiane globale est exclue des deux moitiés.

Pourquoi 1,5 fois l'IQR ? C'est le seuil conventionnel proposé par John Tukey ; il englobe à peu près les queues de distribution au-delà de la dispersion habituelle des données.

Une valeur aberrante peut-elle être légitime ? Oui — une valeur aberrante est simplement statistiquement inhabituelle, et pas forcément une erreur. Analysez-la toujours avant de la supprimer.

Dernière mise à jour: