Qu'est-ce que le calculateur de régression de courbe pondérée ?
Cet outil statistique universel ajuste le modèle de courbe de votre choix à un jeu de données pondéré par les fréquences. Vous saisissez des lignes de type (x, y, fréquence) et vous choisissez un modèle — linéaire, logarithmique, exponentiel en e, exponentiel en ab, puissance, inverse ou quadratique — et il vous renvoie les coefficients ajustés (A, B, et C pour le modèle quadratique), le coefficient de corrélation r, ainsi qu'une interprétation en langage clair de l'intensité de la corrélation. Il s'agit de mathématiques pures : il s'applique donc partout, sans considération de pays ni d'unités.
Comment l'utiliser
Saisissez vos données à raison de trois nombres par ligne, séparés par des virgules ou des espaces : x, y, fréquence. La fréquence (le poids) indique combien de fois la paire (x, y) apparaît ; si vous la laissez vide, elle vaut 1 par défaut (données non pondérées). Choisissez un modèle puis validez. Utilisez au moins 2 points distincts (3 pour le modèle quadratique). Les modèles logarithmique et puissance exigent \(x > 0\) ; les modèles exponentiels et puissance exigent \(y > 0\) ; le modèle inverse exige \(x \ne 0\).
La formule expliquée
La plupart des modèles sont ajustés par linéarisation : on transforme x et/ou y en \((X, Y)\) pour que la relation devienne une droite \(Y = a + b\cdot X\), puis on effectue un ajustement par moindres carrés pondérés avec les poids \(w_i = f_i\). En posant \(N = \Sigma w\), la pente vaut $$b = \frac{N\cdot S_{xy} - S_x\cdot S_y}{N\cdot S_{xx} - S_x^2}$$ et l'ordonnée à l'origine $$a = \frac{S_y - b\cdot S_x}{N},$$ où les sommes sont pondérées. Le coefficient de Pearson r est calculé dans l'espace transformé. Pour les modèles exponentiels en e et en ab, on ajuste \(\ln(y)\) en fonction de x ; pour le modèle puissance, on ajuste \(\ln(y)\) en fonction de \(\ln(x)\) ; le modèle inverse ajuste y en fonction de \(1/x\). Le modèle quadratique résout directement le système 3×3 des équations normales pondérées et fournit le coefficient de corrélation multiple \(R = \sqrt{1 - \text{SSE}/\text{SST}}\).
Exemple détaillé
Points (x, y, f) : (1,2,1), (2,3,1), (3,5,1), (4,4,1), (5,6,1), modèle linéaire. \(N=5\), \(S_x=15\), \(S_y=20\), \(S_{xx}=55\), \(S_{xy}=69\), \(S_{yy}=90\). On obtient alors $$b = \frac{5\cdot 69 - 15\cdot 20}{5\cdot 55 - 225} = \frac{45}{50} = 0{,}9$$ et $$a = \frac{20 - 0{,}9\cdot 15}{5} = 1{,}3.$$ Soit \(y = 1{,}3 + 0{,}9x\), avec \(r = \frac{45}{\sqrt{50\cdot 50}} = 0{,}9\) — une corrélation forte.
FAQ
À quoi sert la colonne fréquence ? Elle pondère chaque point : une fréquence de 3 compte cette paire trois fois dans chaque somme, exactement comme dans un tableau de distribution de fréquences. Une fréquence de 0 supprime la ligne.
Comment l'intensité de la corrélation est-elle classée ? Selon \(|r|\) : au-dessus de 0,7 elle est forte, entre 0,4 et 0,7 modérée, entre 0,2 et 0,4 faible, et à 0,2 ou en dessous il n'y a pas de corrélation.
Pourquoi une erreur peut-elle apparaître ? Si toutes les valeurs de X sont identiques, le dénominateur est nul et aucune droite unique n'existe ; ou bien si vos données ne respectent pas le domaine de définition d'un modèle (par exemple un y négatif ou nul avec un modèle exponentiel).