Qu'est-ce que le résumé à cinq nombres ?
Le résumé à cinq nombres offre une description concise de la distribution d'une série de données. Il se compose de cinq valeurs : le minimum, le premier quartile (Q1), la médiane (Q2), le troisième quartile (Q3) et le maximum. Ensemble, ces nombres mettent en évidence le centre, la dispersion et l'asymétrie de vos données ; ils servent aussi de base à la construction d'un diagramme en boîte (boîte à moustaches).
Comment utiliser ce calculateur
Saisissez vos nombres dans le champ, séparés par des virgules, des espaces ou des retours à la ligne. Le calculateur les trie automatiquement et renvoie les cinq valeurs du résumé ainsi que l'écart interquartile (\(\text{IQR} = Q_3 - Q_1\)), qui mesure la dispersion des 50 % de données situées au centre.
La formule
Une fois les données triées, la médiane correspond à la valeur centrale (ou à la moyenne des deux valeurs centrales lorsque l'effectif est pair). Les données sont ensuite scindées en une moitié inférieure et une moitié supérieure. Q1 est la médiane de la moitié inférieure et Q3 la médiane de la moitié supérieure. Lorsque l'effectif est impair, la valeur centrale est exclue des deux moitiés (méthode exclusive, dite de Tukey). L'IQR se calcule simplement par \(Q_3 - Q_1\).
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
Exemple détaillé
Prenons la série 2, 4, 6, 8, 10, 12, 14. Après tri, le minimum est 2 et le maximum 14. La médiane est la 4ᵉ valeur, soit 8. La moitié inférieure est {2, 4, 6}, dont la médiane (Q1) vaut 4. La moitié supérieure est {10, 12, 14}, dont la médiane (Q3) vaut 12. L'IQR est donc \(12 - 4 = 8\).
Questions fréquentes
Pourquoi existe-t-il plusieurs méthodes de calcul des quartiles ? Les logiciels de statistiques utilisent différentes conventions. Cet outil applique la méthode exclusive, la plus courante, qui exclut la médiane globale lors de la division d'une série de longueur impaire.
Que m'apprend l'IQR ? Il indique la dispersion de la moitié centrale de vos valeurs et sert à détecter les valeurs aberrantes (celles situées au-delà de \(1{,}5 \times \text{IQR}\) des quartiles).
Combien de nombres faut-il saisir ? Il en faut au minimum deux, mais les quartiles deviennent plus pertinents à mesure que le nombre de données augmente.