¿Qué es la calculadora de costes de tokens de IA/LLM?
La mayoría de las APIs de modelos de lenguaje (LLM) —como las de OpenAI, Anthropic, Google y otras— facturan por token, con tarifas distintas para los tokens de entrada (el prompt) y los de salida (la respuesta generada). El precio suele expresarse por cada 1.000 tokens (o por millón). Estos precios se publican normalmente en dólares estadounidenses (USD). Esta calculadora convierte esas tarifas en una cifra clara para que puedas presupuestar una funcionalidad, comparar modelos o prever el gasto de una carga de trabajo en producción antes de lanzarla.
Cómo usarla
Introduce el número de tokens de entrada y tokens de salida de una petición típica y, a continuación, el precio por cada 1.000 tokens en cada caso. De forma opcional, indica el número de llamadas para escalar la estimación a una carga de trabajo completa. La calculadora te devuelve el coste por llamada y el coste total, desglosado entre la parte de entrada y la de salida.
La fórmula explicada
El coste de una sola llamada es:
$$\text{coste} = \frac{\text{tokens\_entrada}}{1000}\times \text{precio\_entrada} + \frac{\text{tokens\_salida}}{1000}\times \text{precio\_salida}$$
Cada cantidad de tokens se divide entre 1.000 porque los precios se cotizan por cada 1.000 tokens. Los tokens de salida suelen ser más caros que los de entrada, y por eso se tarifican por separado. El total no es más que el coste por llamada multiplicado por el número de llamadas.
Ejemplo práctico
Imagina que una petición utiliza 1.000 tokens de entrada a 0,0015 $ por cada 1.000 y genera 500 tokens de salida a 0,002 $ por cada 1.000. Coste de entrada = \((1000/1000) \times 0{,}0015 = 0{,}0015\) $. Coste de salida = \((500/1000) \times 0{,}002 = 0{,}001\) $. Coste por llamada = 0,0025 $. Si ejecutas 10.000 llamadas de este tipo, el total asciende a 25,00 $.
Referencia de Precios Actuales de LLM (por 1K Tokens)
La tabla siguiente lista los precios de API comúnmente publicados para modelos de lenguaje grandes populares, expresados por 1.000 tokens (1K) en dólares estadounidenses. Muchos proveedores publican sus tarifas por 1.000.000 de tokens (1M) en su lugar; para convertir, divide el precio por 1M entre 1.000. Por ejemplo, un modelo con precio de $5,00 por 1M de tokens de entrada cuesta $0,005 por 1K de tokens de entrada.
| Modelo | Entrada ($/1K) | Salida ($/1K) |
|---|---|---|
| GPT-4o | $0,0025 | $0,010 |
| GPT-4o mini | $0,00015 | $0,0006 |
| GPT-3.5 Turbo | $0,0005 | $0,0015 |
| Claude 3.5 Sonnet | $0,003 | $0,015 |
| Claude 3 Haiku | $0,00025 | $0,00125 |
| Gemini 1.5 Pro | $0,00125 | $0,005 |
| Gemini 1.5 Flash | $0,000075 | $0,0003 |
Nota: Los precios de LLM cambian frecuentemente, varían según la región y nivel (p. ej. contexto largo, lote o descuentos de entrada en caché), y pueden diferir para modelos ajustados. Siempre verifica la tarifa actual en la página oficial de precios del proveedor antes de presupuestar. Los valores anteriores son figuras de referencia representativas para introducir en la calculadora, no una cotización garantizada.
Términos Clave Explicados
- Token
- La unidad básica de texto que procesa un LLM. Un token es aproximadamente 4 caracteres o alrededor de ¾ de una palabra en inglés, por lo que 1.000 tokens es aproximadamente 750 palabras. Los modelos facturan por tokens, no por palabras o caracteres.
- Tokens de entrada (instrucción)
- Todos los tokens que envías al modelo en una solicitud — tus instrucciones, el historial de conversación, instrucción del sistema y cualquier contexto recuperado. Estos se cobran a la tarifa de entrada.
- Tokens de salida (finalización)
- Los tokens que el modelo genera en su respuesta. Estos se facturan a la tarifa de salida, que es típicamente más alta que la tarifa de entrada (a menudo 3–4×), por lo que las respuestas más largas cuestan desproporcionadamente más.
- Precios por 1K versus por 1M
- Dos formas equivalentes de citar el mismo precio. Una tarifa de $5,00 por 1.000.000 de tokens es igual a $0,005 por 1.000 tokens. Divide un precio por 1M entre 1.000 para obtener el precio por 1K que usa esta calculadora.
- Ventana de contexto
- El número máximo de tokens (entrada más salida) que un modelo puede manejar en una única solicitud — por ejemplo 128K o 1M de tokens. Limita cuánto puedes enviar y recibir por llamada pero por sí solo no cambia el precio por token.
- Llamada / solicitud
- Un viaje de ida y vuelta a la API: envías tokens de entrada y recibes tokens de salida. El gasto total es el costo de una llamada multiplicado por el número de llamadas que realizas.
Preguntas frecuentes
Mi proveedor indica el precio por millón de tokens, ¿qué pongo? Divide el precio por millón entre 1.000 para obtener el precio por cada 1.000 (por ejemplo, 1,50 $ por millón = 0,0015 $ por cada 1.000).
¿Cómo estimo el número de tokens? Una regla aproximada es contar unos 4 caracteres o unas 0,75 palabras por token en inglés (en español la proporción varía ligeramente), pero usa el tokenizador de tu proveedor para tener precisión.
¿Incluye otras tarifas? No: solo cubre el uso basado en tokens. El ajuste fino (fine-tuning), las imágenes, el audio o el almacenamiento se cobran aparte.