À quoi sert ce calculateur
Cet outil ajuste une courbe de régression logarithmique de la forme \(y = A + B\cdot\ln(x)\) à un tableau d'observations, où chaque ligne porte une fréquence (pondération) f. La pondération par fréquence permet de saisir des données groupées ou répétées de façon compacte : au lieu de répéter la même paire (x, y) un grand nombre de fois, on l'écrit une seule fois avec son effectif f. La méthode relève de la statistique pure et fonctionne de la même manière partout — aucune unité ni règle nationale n'entre en jeu.
Comment l'utiliser
Saisissez un groupe d'observations par ligne sous la forme x y f. La colonne de fréquence est facultative ; si vous l'omettez, chaque ligne compte une fois (f = 1). Chaque x doit être strictement supérieur à zéro, car on calcule le logarithme naturel de x. Indiquez au moins deux lignes avec des valeurs de x distinctes afin que la droite soit déterminée. Choisissez une précision d'affichage (10 chiffres significatifs par défaut) — cela ne modifie que l'arrondi des nombres affichés, jamais le calcul sous-jacent.
La formule expliquée
Avec des groupes i = 1..m, posons \(n = \sum f_i\). Les moyennes pondérées sont $$\overline{\ln x} = \frac{\sum f_i\,\ln x_i}{n} \qquad \bar{y} = \frac{\sum f_i\,y_i}{n}$$ Les sommes des carrés pondérées valent $$S_{xx} = \sum f_i(\ln x_i)^2 - n\cdot\overline{\ln x}^2$$ $$S_{yy} = \sum f_i y_i^2 - n\cdot\bar{y}^2$$ $$S_{xy} = \sum f_i\cdot\ln x_i\cdot y_i - n\cdot\overline{\ln x}\cdot\bar{y}$$ On obtient alors $$B = \frac{S_{xy}}{S_{xx}} \qquad A = \bar{y} - B\cdot\overline{\ln x} \qquad r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}$$
Exemple résolu
Prenons cinq lignes avec toutes f = 1 — (1,2), (2,3), (3,3), (4,4), (5,4) — on obtient \(\overline{\ln x} = 0{,}9574984\), \(\bar{y} = 3{,}2\), \(S_{xx} = 1{,}6154888\), \(S_{yy} = 2{,}8\), \(S_{xy} = 2{,}0382328\). D'où \(B = 1{,}2616933\), \(A = 1{,}9919295\), et \(r = 0{,}9583567\). La courbe ajustée est $$y = 1{,}9919 + 1{,}2617\cdot\ln(x)$$ avec une forte corrélation.
FAQ
À quoi sert la colonne de fréquence ? Elle pondère chaque ligne. Une ligne avec f = 5 est traitée comme cinq observations identiques : elle pèse donc cinq fois plus sur l'ajustement qu'une ligne avec f = 1.
Comment interpréter r ? Un \(|r|\) supérieur à 0,7 indique une corrélation forte, 0,4–0,7 modérée, 0,2–0,4 faible, et inférieure à 0,2 quasi inexistante.
Pourquoi affiche-t-il « ajustement impossible » ? Un ajustement nécessite au moins deux valeurs de x distinctes (sinon \(S_{xx} = 0\)) ainsi qu'une fréquence totale positive. Toutes les valeurs de x doivent être supérieures à zéro pour que \(\ln(x)\) soit défini.