MCPで接続 →

計算を入力してください

公式

広告

結果

推定総コスト
$0.0025
米ドル(USD)
1回あたりのコスト $0.0025
入力コスト $0.0015
出力コスト $0.001

AI・LLMトークン料金計算ツールとは?

OpenAI、Anthropic、Googleなどが提供する大規模言語モデル(LLM)のAPIは、その多くがトークン単位で課金されます。しかも入力(プロンプト)トークンと出力(生成)トークンで単価が異なるのが一般的です。料金は通常、1,000トークンあたり(または100万トークンあたり)で表示されます。この計算ツールは、そうした単価をわかりやすい金額に変換します。新機能のコストを見積もる、複数モデルを比較する、本番ワークロードの費用をリリース前に予測する——そんな場面で役立ちます。※料金はドル(USD)建てで、海外プロバイダーの価格体系を前提としています。

使い方

典型的なリクエスト1回分の入力トークン数出力トークン数を入力し、それぞれの1,000トークンあたりの単価を入力します。さらに呼び出し回数を入力すれば、ワークロード全体の規模に合わせた試算も可能です(任意)。計算結果として、1回あたりのコストと総コストが、入力分・出力分に分けて表示されます。

計算式の解説

1回の呼び出しにかかるコストは次のとおりです。

$$\text{コスト} = \frac{\text{入力トークン数}}{1000}\times \text{入力単価} + \frac{\text{出力トークン数}}{1000}\times \text{出力単価}$$

料金が1Kトークン単位で表示されるため、各トークン数を1,000で割っています。出力トークンは入力トークンよりも単価が高いことが多く、これが両者を分けて計算する理由です。総コストは、1回あたりのコストに呼び出し回数を掛けるだけで求められます。

入力トークンと出力トークンをそれぞれ1Kあたりの単価で掛け合わせ、合計して総コストにする図
総コストは入力トークンと出力トークンの合計で、それぞれ1Kトークンあたりの料金が別々に設定されます。

計算例

あるリクエストで、入力1,000トークンを1Kあたり$0.0015、出力500トークンを1Kあたり$0.002で使うとします。入力コスト=\((1000\div1000)\times0.0015=\$0.0015\)。出力コスト=\((500\div1000)\times0.002=\$0.001\)。1回あたりのコストは$0.0025です。これを10,000回実行すると、総額は$25.00になります。

入力トークンと出力トークンのコストを積み上げて、1回あたりの総コストを示す棒グラフ
出力トークンは1Kあたりの料金が高いことが多く、総コストの大半を占めることがあります。

現在のLLM価格リファレンス(1Kトークンあたり)

以下の表は、人気のある大規模言語モデルの一般的に公開されているAPI価格を、米ドルで1,000トークン(1K)あたりで示しています。多くのプロバイダーは1,000,000トークン(1M)あたりの料金で公表しています。変換するには、1Mあたりの価格を1,000で割ってください。例えば、1Mあたり入力トークン$5.00で価格設定されたモデルは、1K入力トークンあたり$0.005のコストです。

モデル 入力($/1K) 出力($/1K)
GPT-4o $0.0025 $0.010
GPT-4o mini $0.00015 $0.0006
GPT-3.5 Turbo $0.0005 $0.0015
Claude 3.5 Sonnet $0.003 $0.015
Claude 3 Haiku $0.00025 $0.00125
Gemini 1.5 Pro $0.00125 $0.005
Gemini 1.5 Flash $0.000075 $0.0003

注記: LLM価格は頻繁に変更され、地域とティア(例:長文脈、バッチ、キャッシュ入力割引など)によって異なり、微調整されたモデルでは異なる場合があります。予算を立てる前に、必ず公式プロバイダーの価格設定ページで現在のレートを確認してください。上記の値は、電卓に入力するための代表的な参考値であり、確定見積もりではありません。

主要用語の説明

トークン
LLMが処理するテキストの基本単位です。トークンは大まかに4文字、または英語で約¾単語です。1,000トークンは約750単語です。モデルは単語や文字ではなく、トークンで課金されます。
入力(プロンプト)トークン
リクエストでモデルに送信するすべてのトークン — 指示、会話履歴、システムプロンプト、および取得したコンテキストです。これらは入力レートで課金されます。
出力(完了)トークン
モデルが応答で生成するトークンです。これらは出力レートで課金され、通常は入力レートより高い(多くの場合3~4倍)ため、より長い応答はより高い割合でコストがかかります。
1Kあたり対1Mあたりの価格設定
同じ価格を引用する2つの同等の方法です。1,000,000トークンあたり$5.00のレートは、1,000トークンあたり$0.005に等しいです。この電卓が使用する1Kあたりの価格を取得するには、1Mあたりの価格を1,000で割ります。
コンテキストウィンドウ
モデルが単一のリクエストで処理できるトークンの最大数(入力と出力の合計) — 例えば128KまたはM1トークンです。1回の呼び出しで送受信できる量を制限しますが、トークンあたりの価格自体は変わりません。
呼び出し/リクエスト
APIへの1往復:入力トークンを送信して出力トークンを受け取ります。合計費用は、1回の呼び出しのコストに実行した呼び出しの数を掛けたものです。

よくある質問

プロバイダーの料金が100万トークンあたりで表示されています。何を入力すればいい? 100万トークンあたりの価格を1,000で割れば、1Kトークンあたりの単価になります(例:100万あたり$1.50=1Kあたり$0.0015)。

トークン数はどう見積もればいい? 英語の場合、おおよそ4文字または0.75単語で1トークンというのが目安です。ただし正確に把握するには、利用するプロバイダーのトークナイザーを使ってください。日本語はトークンの消費量が英語と異なる点にも注意が必要です。

その他の料金も含まれますか? いいえ。このツールはトークンベースの利用料のみを対象としています。ファインチューニング、画像・音声、ストレージなどの料金は別途発生します。

最終更新: