AI/大模型 Token 费用计算器

每次调用费用	$0.0025
输入费用	$0.0015
输出费用	$0.001

什么是 AI/大模型 Token 费用计算器？

大多数大语言模型（LLM）API——比如 OpenAI、Anthropic、Google 等厂商的服务——都按 token 计费，而且输入（提示词）token 和输出（生成内容）token 通常采用不同的费率。价格一般以每 1,000 个 token（或每百万个 token）报价。本计算器能把这些费率换算成一目了然的金额，方便你在功能上线前估算预算、对比不同模型，或预测生产环境的真实开销。需要注意的是，下文价格以美元（USD）计价，国内厂商（如阿里通义、百度文心、智谱等）多以人民币按千 token 计费，计费口径类似，但具体单价请以各家官网为准。

如何使用

先填入一次典型请求的输入 token 数和输出 token 数，再分别填写两者每 1,000 个 token 的单价。如需估算整体工作负载，可选填调用次数。计算器会给出每次调用的成本与总成本，并拆分为输入和输出两部分，让花费去向清清楚楚。

计算公式详解

单次调用的费用为：

$$\text{cost} = \frac{\text{input\_tokens}}{1000}\times \text{input\_price} + \frac{\text{output\_tokens}}{1000}\times \text{output\_price}$$

由于价格按每 1,000 个 token 报价，所以每项 token 数都要除以 1,000。输出 token 通常比输入 token 更贵，因此两者分开定价。总费用就是单次调用成本乘以调用次数，非常直观。

示意图展示输入 token 和输出 token 各自乘以每 1K 单价后相加得到总成本 — 总成本由输入 token 和输出 token 相加得出，二者按每 1K token 分别计价。

实例演算

假设某次请求用掉 1,000 个输入 token，单价为每千 token 0.0015 美元；生成 500 个输出 token，单价为每千 token 0.002 美元。那么：输入费用 $=(1000/1000)\times 0.0015 = 0.0015$ 美元；输出费用 $=(500/1000)\times 0.002 = 0.001$ 美元；单次调用费用 $= 0.0025$ 美元。若运行 10,000 次这样的调用，总费用即为 25.00 美元。

柱状图将输入 token 成本和输出 token 成本堆叠，显示每次调用的总成本 — 输出 token 每 1K 的价格往往更高，因此可能占据总成本的大部分。

当前大型语言模型定价参考（每1千个令牌）

下表列出了流行大型语言模型的常见公开API价格，以美元表示，每1,000个令牌（1K）。许多服务商按每1,000,000个令牌（1M）发布其价格；若要转换，请将每1M价格除以1,000。例如，一个按每1M输入令牌$5.00定价的模型，其每1K输入令牌的成本为$0.005。

模型	输入 ($/1K)	输出 ($/1K)
GPT-4o	$0.0025	$0.010
GPT-4o mini	$0.00015	$0.0006
GPT-3.5 Turbo	$0.0005	$0.0015
Claude 3.5 Sonnet	$0.003	$0.015
Claude 3 Haiku	$0.00025	$0.00125
Gemini 1.5 Pro	$0.00125	$0.005
Gemini 1.5 Flash	$0.000075	$0.0003

注：大型语言模型定价变化频繁，因地区和等级（如长上下文、批处理或缓存输入折扣）而异，并且对微调模型可能不同。在制定预算之前，请始终在官方服务商定价页面上验证当前费率。上述数值是代表性参考数据，用于代入计算器，并非保证报价。

关键术语解释

令牌: 大型语言模型处理的基本文本单位。一个令牌约为4个字符或英文中约¾个词，因此1,000个令牌约为750个词。模型按令牌计费，而非按词或字符计费。
输入（提示词）令牌: 你在请求中发送给模型的所有令牌——你的指令、对话历史、系统提示词和任何检索到的上下文。这些按输入费率收费。
输出（补全）令牌: 模型在其回复中生成的令牌。这些按输出费率计费，通常高于输入费率（通常为3-4倍），因此较长的响应成本会成倍增加。
每1K与每1M定价: 同一价格的两种等价报价方式。每1,000,000个令牌$5.00的费率等于每1,000个令牌$0.005。将每1M价格除以1,000以获得此计算器使用的每1K价格。
上下文窗口: 模型在单个请求中可以处理的最大令牌数（输入加输出）——例如128K或1M个令牌。它限制了你每次调用可以发送和接收的数量，但本身并不改变每令牌的价格。
调用/请求: 一次往返API：你发送输入令牌并接收输出令牌。总支出是一次调用的成本乘以你进行的调用次数。