À quoi sert cette calculatrice
Cet outil évalue la loi normale bivariée standard, une gaussienne en deux dimensions de moyennes nulles, de variances unitaires sur chacun des axes et dotée d'un seul paramètre libre : le coefficient de corrélation ρ. Pour un point (x, y) donné, elle renvoie deux valeurs : la densité de probabilité conjointe \(f(x, y, \rho)\) en ce point et la probabilité cumulée de queue supérieure (probabilité d'orthant) \(Q(x, y, \rho) = P(U_1 > x \text{ ET } U_2 > y)\). Comme chaque valeur saisie est déjà un score standardisé et sans dimension, la calculatrice est universelle et ne nécessite aucune conversion d'unités.
Comment l'utiliser
Saisissez le point centile x, le point centile y et la corrélation ρ. Ici, « point centile » désigne un seuil standardisé de type z (une coordonnée), et non un centile compris entre 0 et 1. La corrélation doit vérifier \(-1 < \rho < 1\) ; les valeurs \(\pm 1\) sont refusées car la densité devient singulière (division par zéro dans \(\sqrt{1-\rho^{2}}\)).
Les formules expliquées
La densité correspond à la forme gaussienne fermée présentée ci-dessus :
$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$La probabilité d'orthant repose sur l'identité de Sheppard : lorsque \(\rho = 0\), les variables sont indépendantes et \(Q = Q_1(x)\cdot Q_1(y)\), où \(Q_1(t)\) est la fonction de queue supérieure de la loi normale standard univariée. Pour un ρ non nul, on ajoute une intégrale de correction de 0 à ρ, évaluée ici par une quadrature de Gauss–Legendre à 24 nœuds pour garantir la précision.
$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$
Exemple résolu
Pour \(x = 2\), \(y = 0{,}7\), \(\rho = 0{,}8\) : \(1 - \rho^{2} = 0{,}36\), \(\sqrt{\phantom{x}} = 0{,}6\), facteur initial \(= 1/(2\pi\cdot 0{,}6) = 0{,}265258\). Numérateur de l'exposant \(= 4 - 2\cdot 0{,}8\cdot 2\cdot 0{,}7 + 0{,}49 = 2{,}25\), divisé par \(0{,}72\) donne \(3{,}125\). Ainsi \(f = 0{,}265258 \cdot e^{-3{,}125} \approx 0{,}011655\). La probabilité supérieure \(Q \approx 0{,}0212\) — supérieure à la valeur d'indépendance \(0{,}0055\), car une corrélation positive pousse les deux variables à augmenter ensemble.
Comment la corrélation modifie la probabilité d'orthant
La probabilité d'orthant \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) mesure la probabilité que deux variables normales standard dépassent simultanément leurs seuils. En fixant les points de coupure à \(x=1\) et \(y=1\) et en faisant varier la corrélation \(\rho\), on isole l'effet pur de la dépendance. Lorsque \(\rho=0\), les variables sont indépendantes et \(Q\) se factorise en le produit des deux queues univariées, \(Q_1(x)\,Q_1(y)\). Pour une normale standard, \(Q_1(1)=P(U>1)\approx 0.158655\), donc la référence d'indépendance est \(0.158655^2\approx 0.025172\).
| \(\rho\) | Densité \(f(1,1;\rho)\) | Orthant \(Q(1,1;\rho)\) | Indépendance \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
Le comportement est monotone : une corrélation positive rend le dépassement conjoint plus probable (les grandes valeurs ont tendance à se produire ensemble), donc \(Q\) s'élève au-dessus de la valeur d'indépendance ; une corrélation négative tire les deux variables dans des directions opposées, donc le dépassement conjoint devient plus rare et \(Q\) tombe en dessous de \(Q_1 Q_1\). À \(\rho=0\), la probabilité d'orthant est exactement égale au produit \(0.0252\), confirmant la factorisation de l'indépendance.
Interprétation de la densité et de la probabilité d'orthant
La densité \(f\) n'est pas une probabilité. La valeur \(\varphi(x,y;\rho)\) est une densité de probabilité par unité d'aire dans le plan \((x,y)\) ; seule son intégrale sur une région donne une probabilité. La surface atteint son maximum à l'origine \((0,0)\), où le terme exponentiel est égal à 1 et
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$Pour \(\rho=0\), ce pic est \(1/(2\pi)\approx 0.159\), bien en dessous de 1. Lorsque \(\rho\to\pm 1\), le facteur \(1/\sqrt{1-\rho^2}\) diverge, donc la densité au pic peut dépasser 1 — c'est normal pour une densité, car elle concentre la masse de probabilité sur la ligne \(y=\rho x\).
La probabilité d'orthant \(Q\) est une véritable probabilité et se situe toujours dans \([0,1]\). C'est le volume sous la surface de densité sur le quadrant \(\{U_1>x,\,U_2>y\}\). Faits structurels utiles :
- Indépendance (\(\rho=0\)) : \(Q(x,y;0)=Q_1(x)\,Q_1(y)\), le produit des deux queues univariées supérieures.
- Symétrie dans les arguments : en échangeant les rôles des deux coordonnées, \(Q(x,y;\rho)=Q(y,x;\rho)\).
- Identité de réflexion : \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\) (de manière équivalente, exprimable par la fonction de répartition bivariée), et l'inversion du signe d'un argument inverse la corrélation effective : \(P(U_1>x,\,U_2
- Comportement limite \(\rho\to 1^{-}\) : les variables deviennent parfaitement comonotones, \(U_2\approx U_1\), donc \(Q(x,y;\rho)\to Q_1(\max(x,y))\) — les deux dépassements coïncident.
- Comportement limite \(\rho\to -1^{+}\) : les variables deviennent parfaitement contremonotones, \(U_2\approx -U_1\). Le dépassement conjoint dans le quadrant supérieur n'est alors possible que si les deux seuils peuvent être franchis simultanément, donnant \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\), qui est 0 chaque fois que \(x+y\ge 0\).
Parce qu'il n'existe pas de forme fermée pour \(Q\) avec \(\rho\) général, il est évalué numériquement — généralement par la fonction T d'Owen ou par une intégrale unidimensionnelle en \(\rho\) utilisant la quadrature de Gauss-Legendre, dont les deux méthodes reproduisent les valeurs indiquées dans le tableau de comparaison avec une grande précision.
Définitions et glossaire
- Score standardisé (\(x\), \(y\))
- Une coordonnée de type z qui mesure le nombre d'écarts types qu'une valeur est éloignée de sa moyenne. Les entrées \(x\) et \(y\) sont déjà standardisées, donc chacune suit marginalement la distribution normale standard \(N(0,1)\).
- Coefficient de corrélation \(\rho\)
- La corrélation linéaire (de Pearson) entre les deux variables normales standard, avec \(-1<\rho<1\). C'est l'unique paramètre qui gouverne la force avec laquelle les deux coordonnées se déplacent ensemble ; \(\rho=0\) signifie l'indépendance ici, tandis que \(\rho\to\pm1\) signifie une relation linéaire quasi déterministe. Un \(\rho\) observé peut être estimé à partir de données appariées avec un calculateur de corrélation de Pearson.
- Densité jointe \(f(x,y;\rho)\)
- La densité de probabilité normal bivariée standard, \(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\). Elle décrit la probabilité par unité d'aire, non une probabilité elle-même.
- Probabilité d'orthant \(Q(x,y;\rho)\)
- La probabilité jointe de la queue supérieure \(P(U_1>x,\,U_2>y)\) — le volume sous la surface de densité sur le quadrant supérieur-droit défini par les deux seuils. Toujours entre 0 et 1.
- Queue univariée supérieure \(Q_1(t)\)
- La fonction de survie normale standard \(Q_1(t)=P(U>t)=1-\Phi(t)\), la surface dans la queue droite au-delà de \(t\). Par exemple \(Q_1(1)\approx 0.1587\). À \(\rho=0\), \(Q=Q_1(x)Q_1(y)\).
- Fonction d'erreur complémentaire (\(\operatorname{erfc}\))
- Une fonction spéciale liée à la queue normale par \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\). Elle fournit un moyen numériquement stable de calculer les probabilités de queue univariées utilisées dans \(Q\).
- Quadrature de Gauss-Legendre
- Un schéma d'intégration numérique qui approxime une intégrale définie par une somme pondérée de l'intégrande évaluée à des nœuds optimalement choisis. Parce que \(Q(x,y;\rho)\) n'a pas de forme élémentaire fermée, il est couramment évalué en intégrant la densité (ou une fonction de \(\rho\)) avec cette méthode pour obtenir des résultats précis.
FAQ
Pourquoi ρ ne peut-il pas valoir exactement 1 ? À \(\rho = \pm 1\), les deux variables sont parfaitement dépendantes et la distribution se réduit à une droite ; la densité n'a aucune valeur finie en dehors de cette droite.
Que représente Q ? C'est la masse de probabilité contenue dans l'« orthant » supérieur droit, au-delà des deux seuils : \(P(U_1 > x, U_2 > y)\).
Que se passe-t-il pour de grandes valeurs de x ou de y ? La densité tend vers 0 et Q s'approche de 0, car il devient de plus en plus improbable que les deux variables standardisées dépassent simultanément des seuils positifs élevés.