什么是 AI/大模型 Token 费用计算器?
大多数大语言模型(LLM)API——比如 OpenAI、Anthropic、Google 等厂商的服务——都按 token 计费,而且输入(提示词)token 和输出(生成内容)token 通常采用不同的费率。价格一般以每 1,000 个 token(或每百万个 token)报价。本计算器能把这些费率换算成一目了然的金额,方便你在功能上线前估算预算、对比不同模型,或预测生产环境的真实开销。需要注意的是,下文价格以美元(USD)计价,国内厂商(如阿里通义、百度文心、智谱等)多以人民币按千 token 计费,计费口径类似,但具体单价请以各家官网为准。
如何使用
先填入一次典型请求的输入 token 数和输出 token 数,再分别填写两者每 1,000 个 token 的单价。如需估算整体工作负载,可选填调用次数。计算器会给出每次调用的成本与总成本,并拆分为输入和输出两部分,让花费去向清清楚楚。
计算公式详解
单次调用的费用为:
$$\text{cost} = \frac{\text{input\_tokens}}{1000}\times \text{input\_price} + \frac{\text{output\_tokens}}{1000}\times \text{output\_price}$$
由于价格按每 1,000 个 token 报价,所以每项 token 数都要除以 1,000。输出 token 通常比输入 token 更贵,因此两者分开定价。总费用就是单次调用成本乘以调用次数,非常直观。
实例演算
假设某次请求用掉 1,000 个输入 token,单价为每千 token 0.0015 美元;生成 500 个输出 token,单价为每千 token 0.002 美元。那么:输入费用 \(=(1000/1000)\times 0.0015 = 0.0015\) 美元;输出费用 \(=(500/1000)\times 0.002 = 0.001\) 美元;单次调用费用 \(= 0.0025\) 美元。若运行 10,000 次这样的调用,总费用即为 25.00 美元。
当前大型语言模型定价参考(每1千个令牌)
下表列出了流行大型语言模型的常见公开API价格,以美元表示,每1,000个令牌(1K)。许多服务商按每1,000,000个令牌(1M)发布其价格;若要转换,请将每1M价格除以1,000。例如,一个按每1M输入令牌$5.00定价的模型,其每1K输入令牌的成本为$0.005。
| 模型 | 输入 ($/1K) | 输出 ($/1K) |
|---|---|---|
| GPT-4o | $0.0025 | $0.010 |
| GPT-4o mini | $0.00015 | $0.0006 |
| GPT-3.5 Turbo | $0.0005 | $0.0015 |
| Claude 3.5 Sonnet | $0.003 | $0.015 |
| Claude 3 Haiku | $0.00025 | $0.00125 |
| Gemini 1.5 Pro | $0.00125 | $0.005 |
| Gemini 1.5 Flash | $0.000075 | $0.0003 |
注:大型语言模型定价变化频繁,因地区和等级(如长上下文、批处理或缓存输入折扣)而异,并且对微调模型可能不同。在制定预算之前,请始终在官方服务商定价页面上验证当前费率。上述数值是代表性参考数据,用于代入计算器,并非保证报价。
关键术语解释
- 令牌
- 大型语言模型处理的基本文本单位。一个令牌约为4个字符或英文中约¾个词,因此1,000个令牌约为750个词。模型按令牌计费,而非按词或字符计费。
- 输入(提示词)令牌
- 你在请求中发送给模型的所有令牌——你的指令、对话历史、系统提示词和任何检索到的上下文。这些按输入费率收费。
- 输出(补全)令牌
- 模型在其回复中生成的令牌。这些按输出费率计费,通常高于输入费率(通常为3-4倍),因此较长的响应成本会成倍增加。
- 每1K与每1M定价
- 同一价格的两种等价报价方式。每1,000,000个令牌$5.00的费率等于每1,000个令牌$0.005。将每1M价格除以1,000以获得此计算器使用的每1K价格。
- 上下文窗口
- 模型在单个请求中可以处理的最大令牌数(输入加输出)——例如128K或1M个令牌。它限制了你每次调用可以发送和接收的数量,但本身并不改变每令牌的价格。
- 调用/请求
- 一次往返API:你发送输入令牌并接收输出令牌。总支出是一次调用的成本乘以你进行的调用次数。
常见问题
我的服务商按每百万 token 报价,该怎么填? 把每百万 token 的价格除以 1,000,即可得到每千 token 的单价(例如每百万 1.50 美元 = 每千 0.0015 美元)。
如何估算 token 数量? 一个粗略的经验法则是:英文约每 4 个字符或约 0.75 个单词对应 1 个 token;中文 token 占比与英文不同,想要精确数值,请使用服务商提供的 tokenizer(分词工具)实际测算。
这个结果包含其他费用吗? 不包含。这里只计算按 token 计费的部分,微调、图像、音频和存储等费用需另行计算。