LLM VRAM İhtiyacı Hesaplama Aracı

Hesaplamaya Girin

Formül

Sonuç

Tahmini Gereken VRAM

16,8

Ham model ağırlıkları	14 GB
Ek yük (KV önbelleği, aktivasyonlar vb.)	2,8 GB

LLM VRAM İhtiyacı Hesaplama Aracı nedir?

Bu araç, bir büyük dil modelini (LLM) çıkarım (inference) için yüklemek ve çalıştırmak amacıyla ne kadar GPU video belleğine (VRAM) ihtiyacınız olduğunu tahmin eder. Gereken bellek miktarını belirleyen başlıca iki etken, modelin parametre sayısı ve her ağırlığın saklandığı sayısal hassasiyettir. Bir güvenlik/ek yük faktörü ise; KV önbelleği, aktivasyonlar ve CUDA bağlamı gibi, ham ağırlıkların ötesinde bellek tüketen unsurları hesaba katar.

Nasıl kullanılır?

Model boyutunu milyar parametre cinsinden girin (örneğin 7B model için 7, Llama-3 70B için 70). Ardından hassasiyeti seçin: FP32 her ağırlık için 4 bayt, FP16/BF16 2 bayt, INT8 1 bayt ve INT4 nicemlemesi (quantization) 0,5 bayt kullanır. Son olarak ek yük faktörünü belirleyin — kısa bağlamlı çıkarım için 1,2 (yani %20'lik bir tampon) makul bir varsayılan değerdir; uzun bağlamlar veya toplu işlem (batching) için bu değeri artırın.

Formülün açıklaması

$$\text{VRAM (GB)} = \text{Parametre (milyar)} \times \text{Parametre başına bayt} \times \text{Ek yük}$$ 1 milyar bayt ≈ 1 GB olduğundan, milyar cinsinden parametre sayısını parametre başına bayt değeriyle çarpmak doğrudan gigabayt sonucunu verir. Ek yük faktörü de bu sonucu, çalışma zamanı belleğini kapsayacak şekilde ölçeklendirir.

Reklam

FP32, FP16, INT8 ve INT4 hassasiyetleri için parametre başına bayt karşılaştırması (çubuk grafik) — Düşük hassasiyetli formatlar parametre başına daha az bayt kullanarak VRAM'i azaltır.

Modelin parametre sayısının, parametre başına bayt ve bir ek yük katsayısıyla çarpılarak toplam GPU VRAM'ini verdiğini gösteren şema — VRAM = parametre sayısı × parametre başına bayt × ek yük katsayısı.

Örnek hesaplama

FP16 formatında ve 1,2 ek yük faktörüyle 7B'lik bir model için: $$7 \times 2 \times 1{,}2 = 16{,}8 \text{ GB}$$ Bu değer, 24 GB'lık bir ekran kartına rahatlıkla sığar. Aynı model INT4 ile: $$7 \times 0{,}5 \times 1{,}2 = 4{,}2 \text{ GB}$$ yani 8 GB'lık bir GPU'da kolayca çalışır.

Sıkça Sorulan Sorular

Gerçek kullanım neden ham ağırlıklardan daha yüksek? KV önbelleği, bağlam uzunluğu ve toplu işlem boyutuyla birlikte büyür; ayrıca çerçeve (framework), aktivasyonlar ve tamponlar için bellek ayırır. İşte ek yük faktörü tam olarak bunu yaklaşık olarak hesaplar.

Bu hesaplama eğitimi (training) de kapsıyor mu? Hayır. Eğitim; optimizer durumları ve gradyanlar için kabaca 3–4 kat daha fazla bellek gerektirir. Bu tahmin yalnızca çıkarımı (inference) hedefler.

Hangi ek yük değerini kullanmalıyım? Kısa istemler (prompt) için yaklaşık 1,2; uzun bağlamlar veya yoğun toplu işlem için 1,5–2,0 ve üzeri değerler kullanın.

Son güncelleme: 19 Haziran 2026

İlgili hesap makineleri

LLM Token-Kelime Hesaplama Aracı

LLM token sayısını kelimeye veya kelimeyi token'a anında çevirin. ~0,75 kelime/token kuralıyla token maliyetinizi kolayca tahmin edin.
İnternet Hız İhtiyacı Hesaplama Aracı

Eviniz için kaç Mbps internet gerektiğini öğrenin. Tüm cihazlardaki video izleme, oyun, görüntülü görüşme ve gezinmeyi pay faktörüyle toplayın.
LLM API Maliyet Hesaplama

GPT, Claude ve Gemini gibi LLM API'lerinin maliyetini girdi/çıktı token sayısı ve 1K token başına fiyatla hesaplayın. İstek başına ve toplam harcamayı görün.
Yapay Zeka/LLM Token Maliyet Hesaplama Aracı

LLM API çağrılarının maliyetini girdi/çıktı token sayısı ve 1.000 token başına fiyatlarla tahmin edin. Çağrı başına maliyeti ve toplam harcamayı hesaplayın.
LLM Token–Kelime ve Maliyet Hesaplayıcı

LLM token sayısını tahmini kelime sayısına çevirin ve 1.000 token başına fiyattan API maliyetini hesaplayın. GPT, Claude ve diğer modeller için hızlı tahmin.
LLM VRAM İhtiyacı Hesaplayıcı

Bir büyük dil modelini çalıştırmak için gereken GPU VRAM miktarını tahmin edin. Parametreyi milyar cinsinden girin, FP16, 8-bit veya 4-bit kuantizasyon seçin.

Keşfet

PC Güç Kaynağı (PSU) Watt Hesaplama Aracı

PC sisteminiz için doğru PSU watt değerini hesaplayın. İşlemci, ekran kartı, RAM, disk ve fanları ekleyin, %20 güvenlik payıyla önerilen güç kaynağını öğrenin.
SLA Uptime Yüzdesi Hesaplama Aracı

Belirli bir dönemdeki kesinti süresinden SLA çalışma süresi ve erişilebilirlik yüzdesini hesaplayın. Dakika cinsinden kesintiyi %99,9 gibi uptime değerlerine çevirin.
Bulut VM / EC2 Sunucu Maliyet Hesaplama Aracı

Sunucu sayısı, saatlik ücret ve aylık çalışma saatine göre bulut VM veya AWS EC2 sunucularının aylık, günlük ve yıllık maliyetini hesaplayın.
Mbps'den Gbps'ye Çevirici

Mbps'yi anında Gbps'ye çevirin. İnternet hızınızı saniyede megabit olarak girin, saniyede gigabit karşılığını öğrenin (Gbps = Mbps / 1000).
Sunucu Elektrik Tüketimi Maliyet Hesaplayıcı

Sunucularınızı 7/24 çalıştırmanın aylık ve yıllık elektrik maliyetini hesaplayın. Watt, kWh fiyatı ve sunucu sayısını girerek enerji giderinizi öğrenin.