MCP ile bağlan →

Hesaplamaya Girin

Formül

Reklam

Sonuç

Tahmini Toplam Maliyet
$0,0025
USD
Çağrı başına maliyet $0,0025
Girdi maliyeti $0,0015
Çıktı maliyeti $0,001

Yapay Zeka/LLM Token Maliyet Hesaplama Aracı nedir?

OpenAI, Anthropic, Google ve benzeri sağlayıcıların sunduğu büyük dil modeli (LLM) API'lerinin çoğu, ücretlendirmeyi token üzerinden yapar; üstelik girdi (prompt) token'ları ile çıktı (completion) token'ları için farklı tarifeler uygular. Fiyatlar genellikle 1.000 token başına (ya da milyon token başına) belirtilir. Bu araç, söz konusu tarifeleri net bir dolar tutarına çevirir; böylece bir özelliğin bütçesini çıkarabilir, modelleri karşılaştırabilir veya canlıya almadan önce bir üretim iş yükünü öngörebilirsiniz.

Nasıl kullanılır?

Tipik bir istek için girdi token ve çıktı token sayısını girin, ardından her biri için 1.000 token başına fiyatı yazın. İsterseniz tahmini tüm iş yüküne ölçeklemek için çağrı sayısını da girebilirsiniz. Araç, girdi ve çıktı bileşenlerine ayrılmış şekilde çağrı başına maliyeti ve toplam maliyeti verir.

Formül açıklaması

Tek bir çağrının maliyeti şöyledir:

$$\text{maliyet} = \frac{\text{girdi\_token}}{1000}\times \text{girdi\_fiyatı} + \frac{\text{çıktı\_token}}{1000}\times \text{çıktı\_fiyatı}$$

Fiyatlar 1.000 token başına belirtildiği için her token sayısı 1.000'e bölünür. Çıktı token'ları genellikle girdi token'larından daha pahalıdır; bu yüzden ayrı ayrı fiyatlandırılırlar. Toplam ise basitçe çağrı başına maliyetin çağrı sayısıyla çarpımıdır.

Girdi ve çıktı token'larının her birinin 1K başına fiyatıyla çarpılıp toplam maliyete eklendiğini gösteren diyagram
Toplam maliyet, her biri 1K token başına ayrı fiyatlandırılan girdi ve çıktı token'larını birleştirir.

Örnek hesaplama

Diyelim ki bir istek, 1.000 token başına 0,0015 $'dan 1.000 girdi token'ı kullanıyor ve 1.000 token başına 0,002 $'dan 500 çıktı token'ı üretiyor. Girdi maliyeti = \((1000/1000) \times 0{,}0015 = 0{,}0015\) $. Çıktı maliyeti = \((500/1000) \times 0{,}002 = 0{,}001\) $. Çağrı başına maliyet = 0,0025 $. Bu çağrıyı 10.000 kez çalıştırdığınızda toplam 25,00 $ olur.

Girdi ve çıktı token maliyetini üst üste yığarak çağrı başına toplam maliyeti gösteren çubuk grafik
Çıktı token'ları genellikle 1K başına daha pahalıdır, bu yüzden toplama hâkim olabilir.

Güncel LLM Fiyatlandırması Referansı (1K Token başına)

Aşağıdaki tablo, popüler büyük dil modellerine ait yaygın yayınlanan API fiyatlarını US doları cinsinden 1.000 token (1K) başına olarak listeler. Birçok sağlayıcı fiyatlarını 1.000.000 token (1M) başına yayınlamaktadır; dönüştürmek için 1M başına fiyatı 1.000'e bölün. Örneğin, 1M giriş tokeni başına $5,00 fiyatlandırılan bir model, 1K giriş tokeni başına $0,005 tutarındadır.

Model Giriş ($/1K) Çıkış ($/1K)
GPT-4o $0,0025 $0,010
GPT-4o mini $0,00015 $0,0006
GPT-3.5 Turbo $0,0005 $0,0015
Claude 3.5 Sonnet $0,003 $0,015
Claude 3 Haiku $0,00025 $0,00125
Gemini 1.5 Pro $0,00125 $0,005
Gemini 1.5 Flash $0,000075 $0,0003

Not: LLM fiyatlandırması sık sık değişir, bölgeye ve katmana (ör. uzun bağlam, toplu iş veya önbelleğe alınmış giriş indirimleri) göre farklılık gösterir ve ince ayarlı modeller için farklı olabilir. Bütçelemeye başlamadan önce her zaman resmi sağlayıcı fiyatlandırması sayfasından güncel oranı doğrulayın. Yukarıdaki değerler hesaplayıcıya eklemek için temsili referans rakamlarıdır, garantili bir teklif değildir.

Önemli Terimler Açıklandı

Token
Bir LLM'nin işlediği metnin temel birimi. Bir token, İngilizce'de kabaca 4 karakterdir veya bir kelimenin yaklaşık ¾'üdür, bu nedenle 1.000 token, yaklaşık 750 sözcüğe eşittir. Modeller sözcüklere veya karakterlere değil, tokenlara göre faturalandırılır.
Giriş (istem) tokenleri
Bir istekte modele gönderdiğiniz tüm tokenler — talimatlarınız, konuşma geçmişi, sistem istemi ve alınan herhangi bir bağlam. Bunlar giriş oranında ücretlendirilir.
Çıkış (tamamlama) tokenleri
Modelin yanıtında oluşturduğu tokenler. Bunlar, çıkış oranında faturalandırılır; bu genellikle giriş oranından daha yüksektir (genellikle 3–4× arasında), bu nedenle daha uzun yanıtlar orantısız şekilde daha pahalıya mal olur.
Token başına 1K vs 1M fiyatlandırması
Aynı fiyatı belirtmenin iki eşdeğer yolu. 1.000.000 token başına $5,00 oranı, 1.000 token başına $0,005'e eşittir. Bu hesaplayıcının kullandığı 1K başına fiyatı elde etmek için 1M başına fiyatı 1.000'e bölün.
Bağlam penceresi
Bir modelin tek bir istekte işleyebileceği maksimum token sayısı (giriş artı çıkış) — örneğin 128K veya 1M token. Bir çağrıda ne kadar gönderebileceğinizi ve alabileceğinizi sınırlandırır, ancak kendi başına token başına fiyatı değiştirmez.
Çağrı / istek
API'ye bir gidiş-dönüş: giriş tokenlerini gönderirsiniz ve çıkış tokenlerini alırsınız. Toplam harcama, bir çağrının maliyeti ile yaptığınız çağrı sayısının çarpılmasıyla hesaplanır.

Sıkça Sorulan Sorular

Sağlayıcım fiyatı milyon token başına veriyor — ne girmeliyim? Milyon başına fiyatı 1.000'e bölerek 1.000 token başına fiyatı elde edin (örneğin 1M için 1,50 $ = 1K için 0,0015 $).

Token sayısını nasıl tahmin ederim? Kaba bir kural olarak İngilizcede token başına yaklaşık 4 karakter ya da ~0,75 kelime düşer; ancak en doğru sonuç için sağlayıcınızın tokenizer aracını kullanın. (Türkçede sözcük yapısı nedeniyle bu oran değişebilir.)

Diğer ücretleri de kapsıyor mu? Hayır — yalnızca token bazlı kullanımı kapsar. İnce ayar (fine-tuning), görüntü, ses veya depolama ücretleri ayrıdır.

Son güncelleme: