Qu'est-ce que le test du khi-deux d'indépendance ?
Le test du khi-deux (χ²) d'indépendance permet de vérifier si deux variables qualitatives sont liées entre elles. Pour un tableau de contingence 2×2, il compare les effectifs réellement observés aux effectifs que l'on attendrait si les deux variables étaient totalement indépendantes. Plus l'écart est important, plus la valeur du χ² est élevée, ce qui suggère que les variables sont associées.
Comment utiliser ce calculateur
Saisissez les quatre effectifs de votre tableau 2×2 : A et B constituent la première ligne, C et D la seconde. Le calculateur additionne les totaux par ligne, par colonne et le total général, détermine l'effectif théorique de chaque cellule, puis fait la somme des écarts au carré standardisés pour obtenir le χ². Il indique également les degrés de liberté (toujours égaux à 1 pour un tableau 2×2), une p-value approchée, la valeur critique à 0,05 et précise si le résultat est statistiquement significatif.
La formule expliquée
Pour chaque cellule, l'effectif théorique vaut \(E = (\text{total de la ligne} \times \text{total de la colonne}) / \text{total général}\). La statistique de test s'écrit
$$\chi^2 = \sum \frac{(O - E)^2}{E}$$sur les quatre cellules. Avec un seul degré de liberté, la valeur critique au seuil de significativité de 5 % est de 3,841. Si votre χ² dépasse 3,841, vous rejetez l'hypothèse nulle d'indépendance.
Exemple concret
Supposons que A = 10, B = 20, C = 30 et D = 40. Les totaux par ligne sont 30 et 70 ; les totaux par colonne sont 40 et 60 ; le total général est 100. Les effectifs théoriques valent 12, 18, 28 et 42. On obtient alors
$$\chi^2 = \frac{(10-12)^2}{12} + \frac{(20-18)^2}{18} + \frac{(30-28)^2}{28} + \frac{(40-42)^2}{42} \approx 0{,}3333 + 0{,}2222 + 0{,}1429 + 0{,}0952 \approx 0{,}7937$$Comme \(0{,}79 < 3{,}841\), on ne peut pas rejeter l'hypothèse d'indépendance.
Foire aux questions
Pourquoi les degrés de liberté valent-ils toujours 1 ici ? Les degrés de liberté se calculent ainsi : \((\text{nombre de lignes} - 1) \times (\text{nombre de colonnes} - 1) = (2-1)(2-1) = 1\).
Que signifie une p-value faible ? Une p-value inférieure à 0,05 indique que l'association observée est peu probable sous l'hypothèse d'indépendance : les variables sont donc vraisemblablement liées.
La p-value est-elle exacte ? Elle repose sur une approximation numérique classique de la loi du khi-deux à 1 degré de liberté, suffisamment précise pour la plupart des décisions courantes, mais qui ne remplace pas un logiciel statistique complet dans les cas limites.