¿Qué es la función Softplus?
La función Softplus, \(f(x) = \ln(1 + e^{x})\), es una aproximación suave y diferenciable de la activación ReLU (unidad lineal rectificada) que se utiliza en las redes neuronales. A diferencia de ReLU, que presenta un vértice abrupto en el origen, Softplus es suave en todos sus puntos y siempre estrictamente positiva. Esta calculadora construye una tabla con los valores de \(x\), \(f(x)\) y su primera derivada dentro del rango que tú elijas, y dibuja ambas curvas para que aprecies su característica forma que pasa con suavidad de una «S» a una rampa.
Cómo utilizarla
Introduce tres valores: el valor inicial de x (la primera abscisa), el incremento (la separación entre puntos) y el número de repeticiones (cuántas filas quieres generar). Por ejemplo, un valor inicial de -5, un incremento de 0,1 y 101 repeticiones producen valores de \(x\) desde -5,0 hasta +5,0. El resultado es una tabla con desplazamiento más una gráfica de Softplus y su derivada.
La fórmula explicada
Softplus es $$f(x) = \ln(1 + e^{x}).$$ Su derivada es $$f'(x) = \frac{e^{x}}{1 + e^{x}} = \frac{1}{1 + e^{-x}},$$ que coincide exactamente con la sigmoide logística. Cuando \(x\) crece hacia valores muy grandes y positivos, \(f(x)\) tiende a \(x\) y \(f'(x)\) tiende a 1; cuando \(x\) toma valores muy grandes y negativos, \(f(x)\) tiende a 0 y \(f'(x)\) tiende a 0. Para evitar el desbordamiento numérico con valores grandes de \(x\), la herramienta emplea la forma numéricamente estable $$f(x) = \max(x, 0) + \ln\!\left(1 + e^{-|x|}\right).$$
Ejemplo resuelto
En \(x = 0\): $$f(0) = \ln(2) = 0{,}693147 \quad\text{y}\quad f'(0) = 0{,}5.$$ En \(x = 1\): $$f(1) = \ln(1 + 2{,}718282) = 1{,}313262 \quad\text{y}\quad f'(1) = \frac{1}{1 + e^{-1}} = 0{,}731059.$$ En \(x = -1\): $$f(-1) = 0{,}313262 \quad\text{y}\quad f'(-1) = 0{,}268941.$$ Fíjate en la identidad \(f(x) - f(-x) = x\); por ejemplo, \(1{,}313262 - 0{,}313262 = 1\).
Preguntas frecuentes
¿Por qué usar Softplus en lugar de ReLU? Softplus es suave y tiene un gradiente distinto de cero en todos sus puntos, lo que puede facilitar la optimización basada en gradientes, aunque ReLU resulta más barata de calcular.
¿El resultado es siempre positivo? Sí. \(\ln(1 + e^{x}) > 0\) para todo \(x\) finito, porque \(1 + e^{x} > 1\).
¿Qué representa la derivada? Es la pendiente de la curva Softplus y equivale a la sigmoide logística, que varía de forma monótona entre 0 y 1, con valor 0,5 en \(x = 0\).