Ce que fait ce calculateur
Cet outil ajuste une courbe de tendance ab-exponentielle de la forme \(y = A \cdot B^{x}\) à un tableau de distribution de fréquences. Chaque ligne comporte une valeur x, une valeur y et un effectif \(f\) (le nombre d'occurrences, ou le poids, du couple (x, y)). Il s'agit d'une méthode purement statistique qui s'applique de manière identique partout : aucune unité, aucune réglementation locale en jeu.
Mode d'emploi
Saisissez un point de données par ligne sous la forme x, y, f. La valeur y doit être strictement positive, car la méthode calcule le logarithme népérien de y. Pour un ajustement ordinaire sans pondération, fixez chaque effectif à 1 (vous pouvez aussi omettre le troisième nombre : on suppose alors f = 1). Choisissez le nombre de chiffres significatifs pour l'affichage des coefficients, puis relevez A, B et le coefficient de corrélation r.
La formule expliquée
L'astuce consiste à linéariser le modèle : en prenant le logarithme de \(y = A \cdot B^{x}\), on obtient \(\ln y = \ln A + x \cdot \ln B\), soit une droite dans l'espace \((x, \ln y)\). On effectue alors une régression des moindres carrés pondérée par les effectifs de \(\ln y\) en fonction de \(x\). Avec \(n = \sum f\), les moyennes pondérées \(\bar{x}\) et \(\overline{\ln y}\), et les sommes pondérées \(S_{xx}\), \(S_{yy}\), \(S_{xy}\), la pente vaut \(S_{xy}/S_{xx}\) et l'ordonnée à l'origine vaut \(\overline{\ln y} - \bar{x} \cdot \text{pente}\). En passant à l'exponentielle, on obtient \(B = e^{\text{pente}}\) et \(A = e^{\text{ordonnée}}\). Le coefficient de corrélation \(r = S_{xy} / (\sqrt{S_{xx}} \cdot \sqrt{S_{yy}})\) mesure la qualité de l'ajustement du modèle log-linéaire.
$$y = A \cdot B^{x}, \qquad B = e^{\,S_{xy}/S_{xx}}, \quad A = e^{\,\overline{\ln y} - \bar{x}\,(S_{xy}/S_{xx})}$$$$\text{where}\quad \left\{ \begin{aligned} n &= \textstyle\sum f, \quad \bar{x} = \frac{\sum f x}{n}, \quad \overline{\ln y} = \frac{\sum f \ln y}{n} \\ S_{xx} &= \textstyle\sum f x^{2} - n\,\bar{x}^{2} \\ S_{xy} &= \textstyle\sum f\,x \ln y - n\,\bar{x}\,\overline{\ln y} \\ x,\,y,\,f &= \text{Data points (x, y, f)} \end{aligned} \right.$$
Exemple concret
Pour des données qui doublent parfaitement (1, 2), (2, 4), (3, 8), (4, 16) avec \(f = 1\) partout : \(n = 4\), \(\bar{x} = 2{,}5\), \(\overline{\ln y} = 1{,}732868\), \(S_{xx} = 5\), \(S_{xy} = 3{,}465735\), \(S_{yy} = 2{,}402224\). On a donc \(B = e^{3{,}465735/5} = e^{0{,}693147} = 2\), \(A = e^{0} = 1\) et \(r = 1\). La courbe ajustée est ainsi \(y = 1 \cdot 2^{x}\), exactement comme prévu.
FAQ
À quoi sert la colonne des effectifs ? Elle pondère chaque point de données selon sa fréquence d'apparition : une ligne avec \(f = 5\) compte donc comme cinq lignes identiques. Mettez \(f = 1\) partout pour une régression classique.
Comment interpréter r ? \(|r| > 0{,}7\) indique une corrélation forte, 0,4 à 0,7 une corrélation modérée, 0,2 à 0,4 une corrélation faible, et en dessous de 0,2 une corrélation quasi inexistante. r est calculé dans l'espace \((x, \ln y)\).
Pourquoi y doit-il être positif ? Le modèle prend le logarithme népérien de y ; or \(\ln y\) n'est pas défini pour \(y \le 0\), si bien que les lignes non positives sont ignorées.