Calculadora de VRAM necesaria para LLM

Conectar vía MCP →

Ingresar cálculo

Fórmula

Resultados

VRAM estimada necesaria

16,8

GB de memoria de GPU

Tamaño bruto de los pesos	14 GB
Bytes por parámetro	2
Factor de sobrecarga	1,2×

Para qué sirve esta calculadora

La Calculadora de VRAM para LLM estima cuánta memoria de GPU necesitas para cargar y ejecutar un modelo de lenguaje grande. Multiplica el número de parámetros del modelo (en miles de millones) por los bytes que ocupa cada parámetro según la precisión elegida y, después, aplica un factor de sobrecarga que tiene en cuenta las activaciones, la caché KV y los búferes del framework.

Cómo usarla

Indica el tamaño del modelo en miles de millones de parámetros (por ejemplo, 7 para un modelo de 7B o 70 para uno de 70B). Elige la cuantización: FP16/BF16 usa 2 bytes por peso, INT8 usa 1 byte, 4 bits usa 0,5 bytes y 2 bits usa 0,25 bytes. El factor de sobrecarga predeterminado de 1,2 (un margen del 20 %) es un buen punto de partida para la inferencia; auméntalo si trabajas con contextos largos o procesamiento por lotes.

La fórmula al detalle

$$\text{VRAM (GB)} = \text{Par\acute{a}metros (miles de millones)} \times \text{bytes por par\acute{a}metro} \times \text{sobrecarga}$$ Los dos primeros términos dan el tamaño bruto de los pesos del modelo en gigabytes. El multiplicador de sobrecarga reserva la memoria adicional que consumen en tiempo de ejecución PyTorch, CUDA y la caché KV de atención, algo que el tamaño bruto de los pesos por sí solo no contempla.

Tres barras que comparan la VRAM para cuantización FP16, 8 bits y 4 bits — La menor precisión (8 bits, 4 bits) reduce a casi la mitad los bytes por parámetro y la VRAM necesaria.

Diagrama de barras apiladas que muestra la VRAM dividida en pesos, caché KV y sobrecarga — La VRAM total está dominada por los pesos del modelo, más un extra para la caché KV y la sobrecarga.

Ejemplo práctico

Un modelo de 7B con precisión de 4 bits: $7 \times 0{,}5 = 3{,}5$ GB de pesos. Con un factor de sobrecarga de 1,2: $3{,}5 \times 1{,}2 = 4{,}2$ GB. Cabe holgadamente en una GPU de consumo de 8 GB. El mismo modelo en FP16 necesita $7 \times 2 \times 1{,}2 = 16{,}8$ GB, lo que exige una tarjeta de 24 GB.

Preguntas frecuentes

¿Es un cálculo exacto? No: es una estimación para inferencia. El consumo real varía según la longitud del contexto, el tamaño del lote y el framework de servicio. Úsala para planificar, no para afinar hasta el último megabyte.

¿Incluye la memoria de entrenamiento? No. Entrenar requiere muchísimo más (estados del optimizador, gradientes), a menudo 4 veces o más la cifra de inferencia.

¿Qué sobrecarga debo usar? 1,2 es adecuado para inferencia con contexto corto; usa entre 1,3 y 1,5 para contextos largos o solicitudes simultáneas.

Última actualización: 19 de junio de 2026

Calculadoras relacionadas

Calculadora de tokens a palabras para LLM

Convierte tokens de LLM en palabras al instante (y viceversa). Calcula cuántas palabras equivalen a un número de tokens con la regla de ~0,75 palabras por token.
Calculadora de Costes de API de LLM

Calcula el coste de una API de LLM a partir de los tokens de entrada/salida y el precio por cada 1.000 tokens. Estima el coste por petición y el gasto total.
Calculadora de costes de tokens de IA/LLM

Estima el coste de tus llamadas a APIs de LLM según los tokens de entrada y salida y el precio por cada 1.000 tokens. Calcula el coste por llamada y el gasto total.
Calculadora de Tokens a Palabras y Coste de LLM

Convierte tokens de LLM en palabras estimadas y calcula el coste de la API según el precio por cada 1.000 tokens. Estimación rápida para GPT, Claude y más.
Calculadora de VRAM necesaria para un LLM

Calcula la VRAM de GPU (en GB) que necesitas para ejecutar o servir un modelo de lenguaje grande según sus parámetros, precisión y factor de margen.

Descubrir

Calculadora de dosis de agua oxigenada para perros

Calcula la dosis de agua oxigenada al 3% para inducir el vómito en perros según su peso (1–2 ml/kg, máx. 45 ml). Consulta siempre antes con tu veterinario.
Calculadora de coste eléctrico de la minería de criptomonedas

Calcula el coste eléctrico de tu equipo de minería de criptomonedas. Introduce vatios, precio en $/kWh y días para ver el gasto diario, mensual y total.
Calculadora de Porcentaje de Aumento Salarial

Calcula el porcentaje de tu aumento a partir de tu sueldo anterior y el nuevo. Introduce ambas cifras y verás el incremento en dólares y el porcentaje al instante.
Calculadora de impuesto sobre ventas de Nueva York

Calcula el impuesto sobre ventas de Nueva York (EE. UU.) y el precio total. Por defecto usa la tasa combinada de NYC del 8,875%; ajústala por condado.
Calculadora de tiempo de descarga y transferencia de datos

Calcula cuánto tarda una descarga o transferencia de datos según el tamaño del archivo y la velocidad de conexión. Admite KB, MB, GB, TB y de Kbps a Gbps y MB/s.