À quoi sert ce calculateur
Cet outil calcule la dérivée première de la fonction sigmoïde logistique, dotée d'un paramètre de gain (ou pente) a, évaluée en un point x. La sigmoïde est l'une des fonctions d'activation les plus répandues dans les réseaux de neurones et la régression logistique, et sa dérivée est précisément ce dont la rétropropagation a besoin pour mettre à jour les poids. En complément, le calculateur affiche également la valeur de la sigmoïde elle-même et sa dérivée seconde au même point.
Comment l'utiliser
Saisissez le gain a (valeur par défaut : 1) et le point d'évaluation x (valeur par défaut : 0,5). Ces deux grandeurs sont des nombres réels purs, sans dimension ni unité. Lancez le calcul pour lire la dérivée première comme résultat principal ; la valeur de la sigmoïde et la dérivée seconde s'affichent juste en dessous.
La formule expliquée
La sigmoïde s'écrit \( \sigma_a(x) = \dfrac{1}{1 + e^{-ax}} \). Elle possède une propriété bien pratique : sa dérivée peut s'exprimer entièrement à partir de sa propre sortie, soit
$$\sigma'_a(x) = a \cdot \sigma_a(x)\,\bigl(1 - \sigma_a(x)\bigr).$$La dérivée seconde en découle :
$$\sigma''_a(x) = a^2 \cdot \sigma_a(x)\,\bigl(1 - \sigma_a(x)\bigr)\,\bigl(1 - 2\,\sigma_a(x)\bigr).$$Comme \( 1 + e^{-ax} \) est toujours strictement positif, la fonction est définie pour tout réel a et tout réel x : aucune division par zéro n'est possible.
Exemple détaillé
Avec \( a = 1 \) et \( x = 0{,}5 \) : \( a \cdot x = 0{,}5 \), donc \( e^{-0{,}5} \approx 0{,}60653 \) et \( s = \dfrac{1}{1{,}60653} \approx 0{,}622459 \). On obtient alors
$$s' = 1 \cdot 0{,}622459 \cdot (1 - 0{,}622459) \approx 0{,}235004,$$puis
$$s'' = 0{,}235004 \cdot (1 - 2 \cdot 0{,}622459) \approx -0{,}057557.$$
Questions fréquentes
Où la dérivée atteint-elle son maximum ? Lorsque \( a > 0 \), la pente est maximale en \( x = 0 \), où \( s = 0{,}5 \) et où la dérivée vaut \( a/4 \).
Que se passe-t-il quand a = 0 ? La sigmoïde se réduit à la constante \( 0{,}5 \) : la dérivée première et la dérivée seconde sont donc toutes deux nulles.
À quoi sert le paramètre de gain ? Plus \( |a| \) est grand, plus la transition est abrupte (proche d'une fonction en escalier) ; plus \( |a| \) est petit, plus elle est progressive. Un \( a \) négatif inverse la courbe.