Calculadora de costes de tokens de IA/LLM

Coste por llamada	$0,0025
Coste de entrada	$0,0015
Coste de salida	$0,001

¿Qué es la calculadora de costes de tokens de IA/LLM?

La mayoría de las APIs de modelos de lenguaje (LLM) —como las de OpenAI, Anthropic, Google y otras— facturan por token, con tarifas distintas para los tokens de entrada (el prompt) y los de salida (la respuesta generada). El precio suele expresarse por cada 1.000 tokens (o por millón). Estos precios se publican normalmente en dólares estadounidenses (USD). Esta calculadora convierte esas tarifas en una cifra clara para que puedas presupuestar una funcionalidad, comparar modelos o prever el gasto de una carga de trabajo en producción antes de lanzarla.

Cómo usarla

Introduce el número de tokens de entrada y tokens de salida de una petición típica y, a continuación, el precio por cada 1.000 tokens en cada caso. De forma opcional, indica el número de llamadas para escalar la estimación a una carga de trabajo completa. La calculadora te devuelve el coste por llamada y el coste total, desglosado entre la parte de entrada y la de salida.

La fórmula explicada

El coste de una sola llamada es:

$$\text{coste} = \frac{\text{tokens\_entrada}}{1000}\times \text{precio\_entrada} + \frac{\text{tokens\_salida}}{1000}\times \text{precio\_salida}$$

Cada cantidad de tokens se divide entre 1.000 porque los precios se cotizan por cada 1.000 tokens. Los tokens de salida suelen ser más caros que los de entrada, y por eso se tarifican por separado. El total no es más que el coste por llamada multiplicado por el número de llamadas.

Diagrama que muestra los tokens de entrada y de salida, cada uno multiplicado por su precio por 1K y sumados en el costo total — El costo total combina los tokens de entrada y de salida, cada uno con un precio distinto por cada 1K tokens.

Ejemplo práctico

Imagina que una petición utiliza 1.000 tokens de entrada a 0,0015 $ por cada 1.000 y genera 500 tokens de salida a 0,002 $ por cada 1.000. Coste de entrada = $(1000/1000) \times 0{,}0015 = 0{,}0015$ $. Coste de salida = $(500/1000) \times 0{,}002 = 0{,}001$ $. Coste por llamada = 0,0025 $. Si ejecutas 10.000 llamadas de este tipo, el total asciende a 25,00 $.

Gráfico de barras que compara el costo de los tokens de entrada y de salida apilados para mostrar el costo total por llamada — Los tokens de salida suelen costar más por cada 1K, por lo que pueden dominar el total.

Referencia de Precios Actuales de LLM (por 1K Tokens)

La tabla siguiente lista los precios de API comúnmente publicados para modelos de lenguaje grandes populares, expresados por 1.000 tokens (1K) en dólares estadounidenses. Muchos proveedores publican sus tarifas por 1.000.000 de tokens (1M) en su lugar; para convertir, divide el precio por 1M entre 1.000. Por ejemplo, un modelo con precio de $5,00 por 1M de tokens de entrada cuesta $0,005 por 1K de tokens de entrada.

Modelo	Entrada ($/1K)	Salida ($/1K)
GPT-4o	$0,0025	$0,010
GPT-4o mini	$0,00015	$0,0006
GPT-3.5 Turbo	$0,0005	$0,0015
Claude 3.5 Sonnet	$0,003	$0,015
Claude 3 Haiku	$0,00025	$0,00125
Gemini 1.5 Pro	$0,00125	$0,005
Gemini 1.5 Flash	$0,000075	$0,0003

Nota: Los precios de LLM cambian frecuentemente, varían según la región y nivel (p. ej. contexto largo, lote o descuentos de entrada en caché), y pueden diferir para modelos ajustados. Siempre verifica la tarifa actual en la página oficial de precios del proveedor antes de presupuestar. Los valores anteriores son figuras de referencia representativas para introducir en la calculadora, no una cotización garantizada.

Términos Clave Explicados

Token: La unidad básica de texto que procesa un LLM. Un token es aproximadamente 4 caracteres o alrededor de ¾ de una palabra en inglés, por lo que 1.000 tokens es aproximadamente 750 palabras. Los modelos facturan por tokens, no por palabras o caracteres.
Tokens de entrada (instrucción): Todos los tokens que envías al modelo en una solicitud — tus instrucciones, el historial de conversación, instrucción del sistema y cualquier contexto recuperado. Estos se cobran a la tarifa de entrada.
Tokens de salida (finalización): Los tokens que el modelo genera en su respuesta. Estos se facturan a la tarifa de salida, que es típicamente más alta que la tarifa de entrada (a menudo 3–4×), por lo que las respuestas más largas cuestan desproporcionadamente más.
Precios por 1K versus por 1M: Dos formas equivalentes de citar el mismo precio. Una tarifa de $5,00 por 1.000.000 de tokens es igual a $0,005 por 1.000 tokens. Divide un precio por 1M entre 1.000 para obtener el precio por 1K que usa esta calculadora.
Ventana de contexto: El número máximo de tokens (entrada más salida) que un modelo puede manejar en una única solicitud — por ejemplo 128K o 1M de tokens. Limita cuánto puedes enviar y recibir por llamada pero por sí solo no cambia el precio por token.
Llamada / solicitud: Un viaje de ida y vuelta a la API: envías tokens de entrada y recibes tokens de salida. El gasto total es el costo de una llamada multiplicado por el número de llamadas que realizas.

Preguntas frecuentes

Mi proveedor indica el precio por millón de tokens, ¿qué pongo? Divide el precio por millón entre 1.000 para obtener el precio por cada 1.000 (por ejemplo, 1,50 $ por millón = 0,0015 $ por cada 1.000).

¿Cómo estimo el número de tokens? Una regla aproximada es contar unos 4 caracteres o unas 0,75 palabras por token en inglés (en español la proporción varía ligeramente), pero usa el tokenizador de tu proveedor para tener precisión.

¿Incluye otras tarifas? No: solo cubre el uso basado en tokens. El ajuste fino (fine-tuning), las imágenes, el audio o el almacenamiento se cobran aparte.