Yapay Zeka/LLM Token Maliyet Hesaplama Aracı nedir?
OpenAI, Anthropic, Google ve benzeri sağlayıcıların sunduğu büyük dil modeli (LLM) API'lerinin çoğu, ücretlendirmeyi token üzerinden yapar; üstelik girdi (prompt) token'ları ile çıktı (completion) token'ları için farklı tarifeler uygular. Fiyatlar genellikle 1.000 token başına (ya da milyon token başına) belirtilir. Bu araç, söz konusu tarifeleri net bir dolar tutarına çevirir; böylece bir özelliğin bütçesini çıkarabilir, modelleri karşılaştırabilir veya canlıya almadan önce bir üretim iş yükünü öngörebilirsiniz.
Nasıl kullanılır?
Tipik bir istek için girdi token ve çıktı token sayısını girin, ardından her biri için 1.000 token başına fiyatı yazın. İsterseniz tahmini tüm iş yüküne ölçeklemek için çağrı sayısını da girebilirsiniz. Araç, girdi ve çıktı bileşenlerine ayrılmış şekilde çağrı başına maliyeti ve toplam maliyeti verir.
Formül açıklaması
Tek bir çağrının maliyeti şöyledir:
$$\text{maliyet} = \frac{\text{girdi\_token}}{1000}\times \text{girdi\_fiyatı} + \frac{\text{çıktı\_token}}{1000}\times \text{çıktı\_fiyatı}$$
Fiyatlar 1.000 token başına belirtildiği için her token sayısı 1.000'e bölünür. Çıktı token'ları genellikle girdi token'larından daha pahalıdır; bu yüzden ayrı ayrı fiyatlandırılırlar. Toplam ise basitçe çağrı başına maliyetin çağrı sayısıyla çarpımıdır.
Örnek hesaplama
Diyelim ki bir istek, 1.000 token başına 0,0015 $'dan 1.000 girdi token'ı kullanıyor ve 1.000 token başına 0,002 $'dan 500 çıktı token'ı üretiyor. Girdi maliyeti = \((1000/1000) \times 0{,}0015 = 0{,}0015\) $. Çıktı maliyeti = \((500/1000) \times 0{,}002 = 0{,}001\) $. Çağrı başına maliyet = 0,0025 $. Bu çağrıyı 10.000 kez çalıştırdığınızda toplam 25,00 $ olur.
Güncel LLM Fiyatlandırması Referansı (1K Token başına)
Aşağıdaki tablo, popüler büyük dil modellerine ait yaygın yayınlanan API fiyatlarını US doları cinsinden 1.000 token (1K) başına olarak listeler. Birçok sağlayıcı fiyatlarını 1.000.000 token (1M) başına yayınlamaktadır; dönüştürmek için 1M başına fiyatı 1.000'e bölün. Örneğin, 1M giriş tokeni başına $5,00 fiyatlandırılan bir model, 1K giriş tokeni başına $0,005 tutarındadır.
| Model | Giriş ($/1K) | Çıkış ($/1K) |
|---|---|---|
| GPT-4o | $0,0025 | $0,010 |
| GPT-4o mini | $0,00015 | $0,0006 |
| GPT-3.5 Turbo | $0,0005 | $0,0015 |
| Claude 3.5 Sonnet | $0,003 | $0,015 |
| Claude 3 Haiku | $0,00025 | $0,00125 |
| Gemini 1.5 Pro | $0,00125 | $0,005 |
| Gemini 1.5 Flash | $0,000075 | $0,0003 |
Not: LLM fiyatlandırması sık sık değişir, bölgeye ve katmana (ör. uzun bağlam, toplu iş veya önbelleğe alınmış giriş indirimleri) göre farklılık gösterir ve ince ayarlı modeller için farklı olabilir. Bütçelemeye başlamadan önce her zaman resmi sağlayıcı fiyatlandırması sayfasından güncel oranı doğrulayın. Yukarıdaki değerler hesaplayıcıya eklemek için temsili referans rakamlarıdır, garantili bir teklif değildir.
Önemli Terimler Açıklandı
- Token
- Bir LLM'nin işlediği metnin temel birimi. Bir token, İngilizce'de kabaca 4 karakterdir veya bir kelimenin yaklaşık ¾'üdür, bu nedenle 1.000 token, yaklaşık 750 sözcüğe eşittir. Modeller sözcüklere veya karakterlere değil, tokenlara göre faturalandırılır.
- Giriş (istem) tokenleri
- Bir istekte modele gönderdiğiniz tüm tokenler — talimatlarınız, konuşma geçmişi, sistem istemi ve alınan herhangi bir bağlam. Bunlar giriş oranında ücretlendirilir.
- Çıkış (tamamlama) tokenleri
- Modelin yanıtında oluşturduğu tokenler. Bunlar, çıkış oranında faturalandırılır; bu genellikle giriş oranından daha yüksektir (genellikle 3–4× arasında), bu nedenle daha uzun yanıtlar orantısız şekilde daha pahalıya mal olur.
- Token başına 1K vs 1M fiyatlandırması
- Aynı fiyatı belirtmenin iki eşdeğer yolu. 1.000.000 token başına $5,00 oranı, 1.000 token başına $0,005'e eşittir. Bu hesaplayıcının kullandığı 1K başına fiyatı elde etmek için 1M başına fiyatı 1.000'e bölün.
- Bağlam penceresi
- Bir modelin tek bir istekte işleyebileceği maksimum token sayısı (giriş artı çıkış) — örneğin 128K veya 1M token. Bir çağrıda ne kadar gönderebileceğinizi ve alabileceğinizi sınırlandırır, ancak kendi başına token başına fiyatı değiştirmez.
- Çağrı / istek
- API'ye bir gidiş-dönüş: giriş tokenlerini gönderirsiniz ve çıkış tokenlerini alırsınız. Toplam harcama, bir çağrının maliyeti ile yaptığınız çağrı sayısının çarpılmasıyla hesaplanır.
Sıkça Sorulan Sorular
Sağlayıcım fiyatı milyon token başına veriyor — ne girmeliyim? Milyon başına fiyatı 1.000'e bölerek 1.000 token başına fiyatı elde edin (örneğin 1M için 1,50 $ = 1K için 0,0015 $).
Token sayısını nasıl tahmin ederim? Kaba bir kural olarak İngilizcede token başına yaklaşık 4 karakter ya da ~0,75 kelime düşer; ancak en doğru sonuç için sağlayıcınızın tokenizer aracını kullanın. (Türkçede sözcük yapısı nedeniyle bu oran değişebilir.)
Diğer ücretleri de kapsıyor mu? Hayır — yalnızca token bazlı kullanımı kapsar. İnce ayar (fine-tuning), görüntü, ses veya depolama ücretleri ayrıdır.