通过MCP连接 →

输入计算

数学公式

广告

结果

预计总费用
$0.0025
美元
每次调用费用 $0.0025
输入费用 $0.0015
输出费用 $0.001

什么是 AI/大模型 Token 费用计算器?

大多数大语言模型(LLM)API——比如 OpenAI、Anthropic、Google 等厂商的服务——都按 token 计费,而且输入(提示词)token 和输出(生成内容)token 通常采用不同的费率。价格一般以每 1,000 个 token(或每百万个 token)报价。本计算器能把这些费率换算成一目了然的金额,方便你在功能上线前估算预算、对比不同模型,或预测生产环境的真实开销。需要注意的是,下文价格以美元(USD)计价,国内厂商(如阿里通义、百度文心、智谱等)多以人民币按千 token 计费,计费口径类似,但具体单价请以各家官网为准。

如何使用

先填入一次典型请求的输入 token 数输出 token 数,再分别填写两者每 1,000 个 token 的单价。如需估算整体工作负载,可选填调用次数。计算器会给出每次调用的成本与总成本,并拆分为输入和输出两部分,让花费去向清清楚楚。

计算公式详解

单次调用的费用为:

$$\text{cost} = \frac{\text{input\_tokens}}{1000}\times \text{input\_price} + \frac{\text{output\_tokens}}{1000}\times \text{output\_price}$$

由于价格按每 1,000 个 token 报价,所以每项 token 数都要除以 1,000。输出 token 通常比输入 token 更贵,因此两者分开定价。总费用就是单次调用成本乘以调用次数,非常直观。

示意图展示输入 token 和输出 token 各自乘以每 1K 单价后相加得到总成本
总成本由输入 token 和输出 token 相加得出,二者按每 1K token 分别计价。

实例演算

假设某次请求用掉 1,000 个输入 token,单价为每千 token 0.0015 美元;生成 500 个输出 token,单价为每千 token 0.002 美元。那么:输入费用 \(=(1000/1000)\times 0.0015 = 0.0015\) 美元;输出费用 \(=(500/1000)\times 0.002 = 0.001\) 美元;单次调用费用 \(= 0.0025\) 美元。若运行 10,000 次这样的调用,总费用即为 25.00 美元。

柱状图将输入 token 成本和输出 token 成本堆叠,显示每次调用的总成本
输出 token 每 1K 的价格往往更高,因此可能占据总成本的大部分。

当前大型语言模型定价参考(每1千个令牌)

下表列出了流行大型语言模型的常见公开API价格,以美元表示,每1,000个令牌(1K)。许多服务商按每1,000,000个令牌(1M)发布其价格;若要转换,请将每1M价格除以1,000。例如,一个按每1M输入令牌$5.00定价的模型,其每1K输入令牌的成本为$0.005。

模型 输入 ($/1K) 输出 ($/1K)
GPT-4o $0.0025 $0.010
GPT-4o mini $0.00015 $0.0006
GPT-3.5 Turbo $0.0005 $0.0015
Claude 3.5 Sonnet $0.003 $0.015
Claude 3 Haiku $0.00025 $0.00125
Gemini 1.5 Pro $0.00125 $0.005
Gemini 1.5 Flash $0.000075 $0.0003

注:大型语言模型定价变化频繁,因地区和等级(如长上下文、批处理或缓存输入折扣)而异,并且对微调模型可能不同。在制定预算之前,请始终在官方服务商定价页面上验证当前费率。上述数值是代表性参考数据,用于代入计算器,并非保证报价。

关键术语解释

令牌
大型语言模型处理的基本文本单位。一个令牌约为4个字符或英文中约¾个词,因此1,000个令牌约为750个词。模型按令牌计费,而非按词或字符计费。
输入(提示词)令牌
你在请求中发送给模型的所有令牌——你的指令、对话历史、系统提示词和任何检索到的上下文。这些按输入费率收费。
输出(补全)令牌
模型在其回复中生成的令牌。这些按输出费率计费,通常高于输入费率(通常为3-4倍),因此较长的响应成本会成倍增加。
每1K与每1M定价
同一价格的两种等价报价方式。每1,000,000个令牌$5.00的费率等于每1,000个令牌$0.005。将每1M价格除以1,000以获得此计算器使用的每1K价格。
上下文窗口
模型在单个请求中可以处理的最大令牌数(输入加输出)——例如128K或1M个令牌。它限制了你每次调用可以发送和接收的数量,但本身并不改变每令牌的价格。
调用/请求
一次往返API:你发送输入令牌并接收输出令牌。总支出是一次调用的成本乘以你进行的调用次数。

常见问题

我的服务商按每百万 token 报价,该怎么填? 把每百万 token 的价格除以 1,000,即可得到每千 token 的单价(例如每百万 1.50 美元 = 每千 0.0015 美元)。

如何估算 token 数量? 一个粗略的经验法则是:英文约每 4 个字符或约 0.75 个单词对应 1 个 token;中文 token 占比与英文不同,想要精确数值,请使用服务商提供的 tokenizer(分词工具)实际测算。

这个结果包含其他费用吗? 不包含。这里只计算按 token 计费的部分,微调、图像、音频和存储等费用需另行计算。

最后更新: