LLM VRAM Hesaplayıcı | GPU Bellek İhtiyacı Tahmini

Hesaplamaya Girin

Sonuç

Tahmini Gereken VRAM

16,8

GB GPU belleği

Ham ağırlık boyutu	14 GB
Parametre başına bayt	2
Ek yük çarpanı	1,2×

Bu hesaplayıcı ne işe yarar?

LLM VRAM İhtiyacı Hesaplayıcı, bir büyük dil modelini (LLM) yükleyip çalıştırmak için ne kadar GPU belleğine ihtiyacınız olduğunu tahmin eder. Modelin parametre sayısını (milyar cinsinden) seçtiğiniz hassasiyette her parametrenin kapladığı bayt sayısıyla çarpar; ardından aktivasyonları, KV önbelleğini ve çerçeve (framework) tamponlarını hesaba katmak için bir ek yük (overhead) çarpanı uygular.

Nasıl kullanılır?

Model boyutunu milyar parametre cinsinden girin (örneğin 7B model için 7, 70B model için 70). Ardından kuantizasyonu seçin: FP16/BF16 ağırlık başına 2 bayt, INT8 1 bayt, 4-bit 0,5 bayt ve 2-bit 0,25 bayt kullanır. Varsayılan 1,2 ek yük çarpanı (yani %20'lik bir tampon) çıkarım (inference) için makul bir başlangıç noktasıdır; uzun bağlamlı ya da toplu (batch) iş yüklerinde bu değeri artırın.

Formülün açıklaması

$$\text{VRAM (GB)} = \text{Parametre (milyar)} \times \text{parametre başına bayt} \times \text{ek yük}$$ İlk iki terim, model ağırlıklarının gigabayt cinsinden ham boyutunu verir. Ek yük çarpanı ise PyTorch, CUDA ve dikkat (attention) KV önbelleğinin çalışma sırasında tükettiği ekstra belleği ayırır; bu bellek yalnızca ham ağırlık boyutu hesaplandığında göz ardı edilir.

Reklam

FP16, 8 bit ve 4 bit niceleme için VRAM'i karşılaştıran üç çubuk — Daha düşük hassasiyet (8 bit, 4 bit) parametre başına bayt sayısını ve gereken VRAM'i yaklaşık yarıya indirir.

VRAM'i ağırlıklar, KV önbelleği ve ek yük olarak ayıran yığılmış çubuk grafik — Toplam VRAM'in büyük kısmını model ağırlıkları oluşturur, ayrıca KV önbelleği ve ek yük için fazladan yer gerekir.

Örnek hesaplama

4-bit hassasiyette 7B'lik bir model: $$7 \times 0{,}5 = 3{,}5 \text{ GB ağırlık}$$ 1,2 ek yük çarpanıyla: $$3{,}5 \times 1{,}2 = 4{,}2 \text{ GB}$$ Bu, 8 GB'lik bir tüketici GPU'suna rahatça sığar. Aynı model FP16'da ise $7 \times 2 \times 1{,}2 = 16{,}8$ GB gerektirir; bu da 24 GB'lik bir kart anlamına gelir.

Sık sorulan sorular

Bu sonuç kesin mi? Hayır — bu bir çıkarım (inference) tahminidir. Gerçek kullanım; bağlam uzunluğuna, toplu işlem (batch) boyutuna ve kullandığınız sunum çerçevesine göre değişir. Planlama için kullanın, son megabayta kadar kesinlik beklemeyin.

Eğitim (training) belleğini de kapsıyor mu? Hayır. Eğitim çok daha fazla bellek gerektirir (optimizer durumları, gradyanlar) — genellikle çıkarım değerinin 4 katı veya daha fazlası.

Hangi ek yük değerini kullanmalıyım? Kısa bağlamlı çıkarım için 1,2 yeterlidir; uzun bağlam ya da eşzamanlı istekler için 1,3–1,5 arasını tercih edin.

İlgili hesap makineleri

LLM Token-Kelime Hesaplama Aracı

LLM token sayısını kelimeye veya kelimeyi token'a anında çevirin. ~0,75 kelime/token kuralıyla token maliyetinizi kolayca tahmin edin.

LLM API Maliyet Hesaplama

GPT, Claude ve Gemini gibi LLM API'lerinin maliyetini girdi/çıktı token sayısı ve 1K token başına fiyatla hesaplayın. İstek başına ve toplam harcamayı görün.

Yapay Zeka/LLM Token Maliyet Hesaplama Aracı

LLM API çağrılarının maliyetini girdi/çıktı token sayısı ve 1.000 token başına fiyatlarla tahmin edin. Çağrı başına maliyeti ve toplam harcamayı hesaplayın.

LLM Token–Kelime ve Maliyet Hesaplayıcı

LLM token sayısını tahmini kelime sayısına çevirin ve 1.000 token başına fiyattan API maliyetini hesaplayın. GPT, Claude ve diğer modeller için hızlı tahmin.

LLM VRAM İhtiyacı Hesaplama Aracı

Bir büyük dil modelini çalıştırmak için gereken GPU VRAM miktarını (GB); parametre sayısı, hassasiyet ve ek yük faktörüne göre tahmin edin.

Keşfet

Köpekler İçin Hidrojen Peroksit Doz Hesaplayıcı

Köpeklerde kusturmak için kiloya göre %3 hidrojen peroksit dozunu hesaplayın (1–2 mL/kg, maks. 45 mL). Kullanmadan önce mutlaka veterinerinize danışın.

Kripto Madenciliği Elektrik Maliyeti Hesaplama Aracı

Madencilik düzeneğinizin elektrik maliyetini hesaplayın. Watt, $/kWh tarifesi ve gün sayısını girerek günlük, aylık ve toplam enerji giderini görün.

Zam Yüzdesi Hesaplama Aracı

Eski ve yeni maaşınızdan zam yüzdenizi hesaplayın. İki tutarı girin, dolar cinsinden artışı ve yüzde olarak zam oranını anında görün.

New York Satış Vergisi Hesaplama Aracı

New York satış vergisini ve toplam fiyatı hesaplayın. Varsayılan, NYC için %8,875 birleşik orandır; istediğiniz NY ilçesine göre ayarlayın. Hızlı, doğru (ABD).

Dosya İndirme ve Veri Aktarım Süresi Hesaplayıcı

Dosya boyutu ve bağlantı hızından indirme veya veri aktarım süresini hesaplayın. KB, MB, GB, TB ile Kbps, Gbps ve MB/s birimlerini destekler.