AI・LLMトークン料金計算ツールとは?
OpenAI、Anthropic、Googleなどが提供する大規模言語モデル(LLM)のAPIは、その多くがトークン単位で課金されます。しかも入力(プロンプト)トークンと出力(生成)トークンで単価が異なるのが一般的です。料金は通常、1,000トークンあたり(または100万トークンあたり)で表示されます。この計算ツールは、そうした単価をわかりやすい金額に変換します。新機能のコストを見積もる、複数モデルを比較する、本番ワークロードの費用をリリース前に予測する——そんな場面で役立ちます。※料金はドル(USD)建てで、海外プロバイダーの価格体系を前提としています。
使い方
典型的なリクエスト1回分の入力トークン数と出力トークン数を入力し、それぞれの1,000トークンあたりの単価を入力します。さらに呼び出し回数を入力すれば、ワークロード全体の規模に合わせた試算も可能です(任意)。計算結果として、1回あたりのコストと総コストが、入力分・出力分に分けて表示されます。
計算式の解説
1回の呼び出しにかかるコストは次のとおりです。
$$\text{コスト} = \frac{\text{入力トークン数}}{1000}\times \text{入力単価} + \frac{\text{出力トークン数}}{1000}\times \text{出力単価}$$
料金が1Kトークン単位で表示されるため、各トークン数を1,000で割っています。出力トークンは入力トークンよりも単価が高いことが多く、これが両者を分けて計算する理由です。総コストは、1回あたりのコストに呼び出し回数を掛けるだけで求められます。
計算例
あるリクエストで、入力1,000トークンを1Kあたり$0.0015、出力500トークンを1Kあたり$0.002で使うとします。入力コスト=\((1000\div1000)\times0.0015=\$0.0015\)。出力コスト=\((500\div1000)\times0.002=\$0.001\)。1回あたりのコストは$0.0025です。これを10,000回実行すると、総額は$25.00になります。
現在のLLM価格リファレンス(1Kトークンあたり)
以下の表は、人気のある大規模言語モデルの一般的に公開されているAPI価格を、米ドルで1,000トークン(1K)あたりで示しています。多くのプロバイダーは1,000,000トークン(1M)あたりの料金で公表しています。変換するには、1Mあたりの価格を1,000で割ってください。例えば、1Mあたり入力トークン$5.00で価格設定されたモデルは、1K入力トークンあたり$0.005のコストです。
| モデル | 入力($/1K) | 出力($/1K) |
|---|---|---|
| GPT-4o | $0.0025 | $0.010 |
| GPT-4o mini | $0.00015 | $0.0006 |
| GPT-3.5 Turbo | $0.0005 | $0.0015 |
| Claude 3.5 Sonnet | $0.003 | $0.015 |
| Claude 3 Haiku | $0.00025 | $0.00125 |
| Gemini 1.5 Pro | $0.00125 | $0.005 |
| Gemini 1.5 Flash | $0.000075 | $0.0003 |
注記: LLM価格は頻繁に変更され、地域とティア(例:長文脈、バッチ、キャッシュ入力割引など)によって異なり、微調整されたモデルでは異なる場合があります。予算を立てる前に、必ず公式プロバイダーの価格設定ページで現在のレートを確認してください。上記の値は、電卓に入力するための代表的な参考値であり、確定見積もりではありません。
主要用語の説明
- トークン
- LLMが処理するテキストの基本単位です。トークンは大まかに4文字、または英語で約¾単語です。1,000トークンは約750単語です。モデルは単語や文字ではなく、トークンで課金されます。
- 入力(プロンプト)トークン
- リクエストでモデルに送信するすべてのトークン — 指示、会話履歴、システムプロンプト、および取得したコンテキストです。これらは入力レートで課金されます。
- 出力(完了)トークン
- モデルが応答で生成するトークンです。これらは出力レートで課金され、通常は入力レートより高い(多くの場合3~4倍)ため、より長い応答はより高い割合でコストがかかります。
- 1Kあたり対1Mあたりの価格設定
- 同じ価格を引用する2つの同等の方法です。1,000,000トークンあたり$5.00のレートは、1,000トークンあたり$0.005に等しいです。この電卓が使用する1Kあたりの価格を取得するには、1Mあたりの価格を1,000で割ります。
- コンテキストウィンドウ
- モデルが単一のリクエストで処理できるトークンの最大数(入力と出力の合計) — 例えば128KまたはM1トークンです。1回の呼び出しで送受信できる量を制限しますが、トークンあたりの価格自体は変わりません。
- 呼び出し/リクエスト
- APIへの1往復:入力トークンを送信して出力トークンを受け取ります。合計費用は、1回の呼び出しのコストに実行した呼び出しの数を掛けたものです。
よくある質問
プロバイダーの料金が100万トークンあたりで表示されています。何を入力すればいい? 100万トークンあたりの価格を1,000で割れば、1Kトークンあたりの単価になります(例:100万あたり$1.50=1Kあたり$0.0015)。
トークン数はどう見積もればいい? 英語の場合、おおよそ4文字または0.75単語で1トークンというのが目安です。ただし正確に把握するには、利用するプロバイダーのトークナイザーを使ってください。日本語はトークンの消費量が英語と異なる点にも注意が必要です。
その他の料金も含まれますか? いいえ。このツールはトークンベースの利用料のみを対象としています。ファインチューニング、画像・音声、ストレージなどの料金は別途発生します。