¿Qué es la función Softsign?
La función Softsign es una función de activación suave que se utiliza en redes neuronales y se define como \(\phi(x) = \frac{x}{1 + |x|}\). Transforma cualquier entrada real en el intervalo abierto (-1, 1), de forma parecida a la tangente hiperbólica, pero se acerca a sus límites de saturación con mayor lentitud. Esa saturación más gradual ayuda a mitigar el problema del desvanecimiento del gradiente durante el entrenamiento. Esta calculadora devuelve tanto el valor de la función \(\phi(x)\) como, en primer lugar, su primera derivada \(\phi'(x)\).
Cómo usar esta calculadora
Introduce cualquier número real en x —positivo, negativo o cero— y obtendrás \(\phi'(x)\) (la pendiente de la curva Softsign) junto con \(\phi(x)\) (la salida de la activación). No intervienen unidades: x es un número real puro y adimensional. El valor por defecto es x = 0,5.
La fórmula explicada
La derivada de \(\phi(x) = \frac{x}{1 + |x|}\) es $$\phi'(x) = \frac{1}{\left(1 + |x|\right)^{2}}.$$ Como el denominador \((1 + |x|)\) siempre vale al menos 1, la derivada es siempre estrictamente positiva y se mantiene en el intervalo (0, 1]. Su valor máximo, 1, se alcanza en x = 0, donde la función presenta su mayor pendiente. A medida que \(|x|\) crece, \(\phi'(x)\) tiende a 0, lo que refleja la saturación de la función.
Ejemplo resuelto
Para x = 0,5: \(|x| = 0{,}5\), por lo que \(1 + |x| = 1{,}5\). El valor de la función es $$\phi(0{,}5) = \frac{0{,}5}{1{,}5} = 0{,}333333\ldots,$$ y la derivada es $$\phi'(0{,}5) = \frac{1}{1{,}5^{2}} = \frac{1}{2{,}25} = 0{,}444444\ldots$$ Así, en x = 0,5 la curva Softsign tiene una salida cercana a 0,3333 y una pendiente próxima a 0,4444.
Preguntas frecuentes
¿Es la función Softsign derivable en todo punto? Sí. Aunque \(|x|\) tiene un punto anguloso en x = 0, las derivadas laterales por la izquierda y por la derecha de \(\phi\) valen ambas 1 en ese punto, de modo que \(\phi\) es derivable en 0 y en cualquier otro lugar.
¿Puede ser negativa la derivada? No. \(\phi'(x) = \frac{1}{(1 + |x|)^2}\) siempre es positiva, ya que es uno dividido entre un número positivo elevado al cuadrado.
¿En qué se diferencia Softsign de tanh? Ambas saturan hacia (-1, 1), pero Softsign emplea colas polinómicas \((1/x^2)\) en lugar de las colas exponenciales de tanh, por lo que satura más despacio y conserva gradientes algo mayores lejos del cero.