¿Qué es la regresión logarítmica?
La regresión logarítmica ajusta una curva de la forma \(y = A + B\cdot\ln(x)\) a tus datos. Resulta muy útil cuando una magnitud crece rápidamente al principio y luego se estabiliza, de modo que aumentos multiplicativos iguales en x generan incrementos aditivos aproximadamente iguales en y. Al aplicar el logaritmo natural a cada valor de x, el problema se convierte en un ajuste lineal corriente (por mínimos cuadrados) sobre la variable transformada \(u = \ln(x)\).
Cómo usar esta calculadora
Introduce tus datos en la tabla, un par (x, y) por línea, separados por una coma o un espacio. Cada valor de x debe ser estrictamente positivo, ya que \(\ln(x)\) no está definido para cero ni para números negativos; las filas con esos valores y las líneas en blanco se omiten. Elige cuántas cifras significativas quieres mostrar y consulta la ordenada en el origen \(A\), el coeficiente \(B\), el coeficiente de correlación \(r\) y las medias.
La fórmula explicada
Sea \(u_i = \ln(x_i)\). Calcula las medias de \(u\) y de \(y\), después las sumas de cuadrados \(S_{xx} = \sum (u-\bar{u})^2\), \(S_{yy} = \sum (y-\bar{y})^2\) y el producto cruzado \(S_{xy} = \sum (u-\bar{u})(y-\bar{y})\). La pendiente es $$ B = \frac{S_{xy}}{S_{xx}}, $$ la ordenada en el origen es $$ A = \bar{y} - B\cdot\bar{u} $$ y la correlación es $$ r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}. $$ Ten en cuenta que la «media de x» que se muestra es la media geométrica \(\exp(\bar{u})\), y no la media aritmética, porque el ajuste se realiza en el espacio logarítmico.
Ejemplo resuelto
Para los puntos (1, 2.0), (2, 4.0), (3, 5.0), (4, 5.5), (5, 6.0): \(\text{mediaLnX} = 0.957498\), \(\text{mediaY} = 4.5\), \(S_{xx} = 1.615493\), \(S_{yy} = 10.0\), \(S_{xy} = 4.003192\). Así, \(B = 2.4780\), \(A = 2.1273\) y \(r = 0.9963\) (correlación fuerte). La línea ajustada es $$ y = 2.1273 + 2.4780\cdot\ln(x), $$ y la media geométrica $$ x = \exp(0.957498) = 2.6051. $$
Preguntas frecuentes
¿Por qué la «media de x» no es el promedio de mis valores de x? Porque la regresión se calcula sobre \(\ln(x)\), el centro natural de los datos de x en este modelo es la media geométrica \(\exp(\text{media de }\ln x)\), que es precisamente el valor que se informa.
¿Cómo interpreto el coeficiente de correlación r? Un \(|r|\) superior a 0.7 indica una relación fuerte; entre 0.4 y 0.7, moderada; entre 0.2 y 0.4, débil; y por debajo de 0.2, prácticamente sin correlación.
¿Qué ocurre si todos mis valores de x son iguales? Entonces \(S_{xx} = 0\) y la pendiente queda indefinida (división por cero), por lo que no se puede calcular el ajuste; necesitas al menos dos valores de x distintos.