LLM APIコスト計算機とは?
この計算機は、GPT・Claude・Geminiといった大規模言語モデル(LLM)のAPIを呼び出す際にかかる料金を試算するツールです。各プロバイダーはトークン単位で課金しており、送信するトークン(入力/プロンプト)とモデルが生成するトークン(出力/補完)で単価が異なるのが一般的です。料金は1,000トークンあたり、または100万トークンあたりで表示されることが多く、本ツールでは1,000(1K)トークンあたりの単価で計算します。なお、これらの料金は基本的に米ドル建てで提示されるため、日本円での予算管理には別途為替レートの換算が必要になります。
使い方
まず、1リクエストあたりの入力トークン数と出力トークン数を入力し、それぞれの1,000トークンあたりの単価を入力します。次に、同じ条件で実行する予定のリクエスト件数を設定してください。計算機は、1リクエストあたりのコスト、入力分と出力分の内訳、そして見込みの総額を算出します。
ヒント:プロバイダーが100万トークンあたりの料金を表示している場合は、その数値を1,000で割れば1Kあたりの単価が求められます(例:100万トークンあたり$0.50 → 1Kあたり$0.0005)。
計算式の解説
基本となる計算式は コスト =(入力トークン ÷ 1000)× 入力単価 +(出力トークン ÷ 1000)× 出力単価 です。トークン数を1,000で割ることで「何千トークンか」という単位に換算し、それに1Kあたりの単価を掛けます。この2つの積を合計したものが1リクエストあたりのコストとなり、これにリクエスト件数を掛けると総額が求められます。
$$\text{Total Cost} = \left( \frac{\text{Input Tokens}}{1000} \times \text{Input Price} + \frac{\text{Output Tokens}}{1000} \times \text{Output Price} \right) \times \text{Requests}$$
計算例
たとえば、1リクエストで入力1,000トークン(1Kあたり$0.0005)、出力500トークン(1Kあたり$0.0015)を使うとします。入力コストは \(\left(1000 \div 1000\right) \times 0.0005 = \$0.0005\)、出力コストは \(\left(500 \div 1000\right) \times 0.0015 = \$0.00075\)。1リクエストあたりのコストは \(\$0.00125\) となります。これを1,000リクエスト実行すると、総額は \(\$1.25\) です。
よくある質問
トークンとは何を指しますか? 英語ではおおよそ単語の4分の3、文字数にすると約4文字に相当します。句読点やスペースもトークンを消費します。なお、日本語は1文字あたりのトークン消費が英語より多くなる傾向があるため、同じ文章量でも英語よりコストが高くなりやすい点に注意してください。
入力と出力は同じ料金ですか? 通常は異なります。出力トークンは入力トークンの2〜4倍ほど高いことが多いため、それぞれの単価を別々に入力してください。
キャッシュやバッチ割引は反映されますか? いいえ。本ツールは定価ベースのシンプルな見積もりです。プロバイダー独自の割引がある場合は、あらかじめ実質的な1K単価に反映させてから入力してください。