AI・LLMトークン料金計算ツール｜API費用をシミュレーション

1回あたりのコスト	$0.0025
入力コスト	$0.0015
出力コスト	$0.001

AI・LLMトークン料金計算ツールとは？

OpenAI、Anthropic、Googleなどが提供する大規模言語モデル（LLM）のAPIは、その多くがトークン単位で課金されます。しかも入力（プロンプト）トークンと出力（生成）トークンで単価が異なるのが一般的です。料金は通常、1,000トークンあたり（または100万トークンあたり）で表示されます。この計算ツールは、そうした単価をわかりやすい金額に変換します。新機能のコストを見積もる、複数モデルを比較する、本番ワークロードの費用をリリース前に予測する——そんな場面で役立ちます。※料金はドル（USD）建てで、海外プロバイダーの価格体系を前提としています。

使い方

典型的なリクエスト1回分の入力トークン数と出力トークン数を入力し、それぞれの1,000トークンあたりの単価を入力します。さらに呼び出し回数を入力すれば、ワークロード全体の規模に合わせた試算も可能です（任意）。計算結果として、1回あたりのコストと総コストが、入力分・出力分に分けて表示されます。

計算式の解説

1回の呼び出しにかかるコストは次のとおりです。

$$\text{コスト} = \frac{\text{入力トークン数}}{1000}\times \text{入力単価} + \frac{\text{出力トークン数}}{1000}\times \text{出力単価}$$

料金が1Kトークン単位で表示されるため、各トークン数を1,000で割っています。出力トークンは入力トークンよりも単価が高いことが多く、これが両者を分けて計算する理由です。総コストは、1回あたりのコストに呼び出し回数を掛けるだけで求められます。

入力トークンと出力トークンをそれぞれ1Kあたりの単価で掛け合わせ、合計して総コストにする図 — 総コストは入力トークンと出力トークンの合計で、それぞれ1Kトークンあたりの料金が別々に設定されます。

計算例

あるリクエストで、入力1,000トークンを1Kあたり$0.0015、出力500トークンを1Kあたり$0.002で使うとします。入力コスト＝$(1000\div1000)\times0.0015=\$0.0015$。出力コスト＝$(500\div1000)\times0.002=\$0.001$。1回あたりのコストは$0.0025です。これを10,000回実行すると、総額は$25.00になります。

入力トークンと出力トークンのコストを積み上げて、1回あたりの総コストを示す棒グラフ — 出力トークンは1Kあたりの料金が高いことが多く、総コストの大半を占めることがあります。

現在のLLM価格リファレンス（1Kトークンあたり）

以下の表は、人気のある大規模言語モデルの一般的に公開されているAPI価格を、米ドルで1,000トークン（1K）あたりで示しています。多くのプロバイダーは1,000,000トークン（1M）あたりの料金で公表しています。変換するには、1Mあたりの価格を1,000で割ってください。例えば、1Mあたり入力トークン$5.00で価格設定されたモデルは、1K入力トークンあたり$0.005のコストです。

モデル	入力（$/1K）	出力（$/1K）
GPT-4o	$0.0025	$0.010
GPT-4o mini	$0.00015	$0.0006
GPT-3.5 Turbo	$0.0005	$0.0015
Claude 3.5 Sonnet	$0.003	$0.015
Claude 3 Haiku	$0.00025	$0.00125
Gemini 1.5 Pro	$0.00125	$0.005
Gemini 1.5 Flash	$0.000075	$0.0003

注記： LLM価格は頻繁に変更され、地域とティア（例：長文脈、バッチ、キャッシュ入力割引など）によって異なり、微調整されたモデルでは異なる場合があります。予算を立てる前に、必ず公式プロバイダーの価格設定ページで現在のレートを確認してください。上記の値は、電卓に入力するための代表的な参考値であり、確定見積もりではありません。

主要用語の説明

トークン: LLMが処理するテキストの基本単位です。トークンは大まかに4文字、または英語で約¾単語です。1,000トークンは約750単語です。モデルは単語や文字ではなく、トークンで課金されます。
入力（プロンプト）トークン: リクエストでモデルに送信するすべてのトークン — 指示、会話履歴、システムプロンプト、および取得したコンテキストです。これらは入力レートで課金されます。
出力（完了）トークン: モデルが応答で生成するトークンです。これらは出力レートで課金され、通常は入力レートより高い（多くの場合3～4倍）ため、より長い応答はより高い割合でコストがかかります。
1Kあたり対1Mあたりの価格設定: 同じ価格を引用する2つの同等の方法です。1,000,000トークンあたり$5.00のレートは、1,000トークンあたり$0.005に等しいです。この電卓が使用する1Kあたりの価格を取得するには、1Mあたりの価格を1,000で割ります。
コンテキストウィンドウ: モデルが単一のリクエストで処理できるトークンの最大数（入力と出力の合計） — 例えば128KまたはM1トークンです。1回の呼び出しで送受信できる量を制限しますが、トークンあたりの価格自体は変わりません。
呼び出し/リクエスト: APIへの1往復：入力トークンを送信して出力トークンを受け取ります。合計費用は、1回の呼び出しのコストに実行した呼び出しの数を掛けたものです。