Conectar vía MCP →

Ingresar cálculo

Introduce K números reales, separados por comas, espacios o saltos de línea.

Fórmula

Publicidad

Resultados

Softmax σ(z)
0.0900305732, 0.2447284711, 0.6652409558
distribución de probabilidad (suma 1)
Longitud del vector K 3
Suma de las salidas 1
Argmax (índice desde 1) 3
Probabilidad máxima 0,6652409558

¿Qué es la función softmax?

La función softmax toma un vector de K números reales y lo transforma en una distribución de probabilidad: cada salida queda estrictamente entre 0 y 1, y las K salidas suman exactamente 1. Es la función de activación habitual en la capa de salida de los clasificadores basados en redes neuronales, donde convierte las puntuaciones brutas del modelo (los logits) en probabilidades de clase. Al ser adimensional, las entradas son números puros, sin unidades.

Diagrama plano que muestra un vector de tres números reales transformado en tres barras de probabilidad que suman uno
Softmax convierte un vector de números reales en una distribución de probabilidad que suma 1.

Cómo usar esta calculadora

Escribe tu vector de entrada en el recuadro como una lista de números separados por comas, espacios o saltos de línea (por ejemplo, 1, 2, 3). Los números pueden ser positivos, negativos, cero o decimales. Pulsa calcular y obtendrás la probabilidad softmax de cada componente, la suma de las salidas (que debe valer 1) y el argmax: el índice (empezando en 1) de la mayor probabilidad.

La fórmula explicada

Para cada componente j, el softmax es \(\sigma(z)_j = e^{z_j} / \sum_{k} e^{z_k}\). Aplicar la exponencial hace que todos los términos sean positivos, y dividir por el total los normaliza para que sumen 1. Para garantizar la estabilidad numérica, esta calculadora resta el valor máximo m a cada elemento antes de exponenciar:

$$\sigma(z)_j = \frac{e^{\,z_j - m}}{\displaystyle\sum_{k} e^{\,z_k - m}}$$

El factor común \(e^{-m}\) se cancela, de modo que el resultado es idéntico y, a la vez, se evita el desbordamiento (overflow) con entradas grandes.

Publicidad
Diagrama plano de la estructura de la fórmula softmax con exponenciales sobre una suma de exponenciales
Cada salida es la exponencial de un elemento dividida entre la suma de las exponenciales de todos los elementos.

Ejemplo resuelto

Para \(z = (1, 2, 3)\): \(e^{1} = 2{,}71828\), \(e^{2} = 7{,}38906\), \(e^{3} = 20{,}08554\), que suman \(30{,}19287\). Al dividir cada uno se obtiene

$$\sigma = (0{,}09003,\ 0{,}24473,\ 0{,}66524)$$

cuyo total es 1. El argmax es el índice 3, la mayor entrada, con una probabilidad de \(0{,}66524\).

Preguntas frecuentes

¿Por qué las salidas siempre suman 1? Porque cada exponencial se divide entre la suma de todas las exponenciales; esa normalización garantiza que el total sea 1.

¿Qué ocurre si todas las entradas son iguales? El resultado es una distribución uniforme en la que cada salida vale \(1/K\).

¿Sumar una constante a cada entrada cambia el resultado? No. El softmax es invariante a desplazamientos: sumar la misma constante c a todas las entradas no altera la salida, y por eso restar el máximo es totalmente seguro.

Última actualización: