Qu'est-ce que la variance d'échantillon ?
La variance d'échantillon (\(s^2\)) mesure la dispersion d'un ensemble de données autour de leur moyenne. Il s'agit de la moyenne des carrés des écarts à la moyenne, mais avec n − 1 au dénominateur plutôt que n. Diviser par n − 1 (correction de Bessel) fournit une estimation sans biais de la véritable variance de la population lorsque l'on ne dispose que d'un échantillon des données.
Comment utiliser ce calculateur
Saisissez vos nombres séparés par des virgules ou des espaces — par exemple 4, 8, 15, 16, 23, 42. Le calculateur renvoie la variance d'échantillon, l'écart-type d'échantillon, la moyenne, l'effectif et la somme des carrés des écarts, afin que vous puissiez vérifier chaque étape.
La formule expliquée
Calculez d'abord la moyenne \(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\). Ensuite, pour chaque valeur, soustrayez la moyenne et élevez la différence au carré. Additionnez ces carrés des écarts pour obtenir \(\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}\). Enfin, divisez par n − 1 pour obtenir la variance d'échantillon. La racine carrée de ce résultat donne l'écart-type d'échantillon \(s\).
$$s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2} \qquad \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$
Exemple résolu
Pour la série 4, 8, 15, 16, 23, 42 : la somme vaut 108 et \(n = 6\), la moyenne est donc 18. Les carrés des écarts sont 196, 100, 9, 4, 25 et 576, dont le total fait 910. Avec une moyenne de 18, on obtient $$\sum = 196+100+9+4+25+576 = 910,$$ soit une variance $$= \frac{910}{5} = 182.$$ Vérifiez toujours votre moyenne avant de diviser, car la moindre erreur sur celle-ci fausse l'ensemble du calcul.
FAQ
Pourquoi diviser par n − 1 et non par n ? Diviser par n sous-estime la dispersion de la population ; n − 1 corrige ce biais.
Quand faut-il plutôt utiliser la variance de population ? N'utilisez la variance de population (division par n) que lorsque vos données englobent tous les membres de la population, et non un simple échantillon.
Que signifie une variance plus élevée ? Une variance plus élevée indique que les données sont plus largement dispersées autour de la moyenne.