什么是大模型 API 费用计算器?
这个计算器可以帮你估算调用大语言模型(LLM)API 需要花多少钱,比如 GPT、Claude、Gemini 这类海外主流模型。各家服务商都是按 Token 计费的,而且通常对你发送的 Token(输入/Prompt)和模型生成的 Token(输出/Completion)采用不同的单价。官方报价一般以每 1,000(1K)个 Token 或每 1,000,000(1M)个 Token 计算——本工具采用每 1,000(1K)个 Token 的口径。需要注意,这些价格多以美元($)报价,国内模型(如文心、通义、豆包等)的计费规则和单价可能有所不同,使用时请以对应服务商的实际定价为准。
使用方法
先填写单次请求的输入 Token 数和输出 Token 数,再分别填入两者的每千 Token 单价。然后设置你预计要发起多少次相同的请求。计算器会给出单次请求的费用、输入与输出费用的拆分,以及预计的总花费。
小提示:如果你的服务商报价是按每百万(1M)Token 计算的,把这个数字除以 1,000 就能换算成每千 Token 单价(例如 \(\$0.50 / 1M = \$0.0005 / 1K\))。
计算公式解析
核心公式为 $$\text{费用} = \left( \frac{\text{输入 Token}}{1000} \times \text{输入单价} + \frac{\text{输出 Token}}{1000} \times \text{输出单价} \right) \times \text{请求次数}$$。把 Token 数量除以 1,000,就是将原始 Token 数换算成"千 Token"为单位,再乘以对应的每千 Token 单价。两部分相加即为单次请求的费用,再乘以请求次数,就是总花费。
实例演示
假设一次请求用了 1,000 个输入 Token,单价为 \(\$0.0005 / 1K\);以及 500 个输出 Token,单价为 \(\$0.0015 / 1K\)。输入费用 $$= \left( \frac{1000}{1000} \right) \times 0.0005 = \$0.0005$$;输出费用 $$= \left( \frac{500}{1000} \right) \times 0.0015 = \$0.00075$$;单次请求费用 \(= \$0.00125\)。若发起 1,000 次请求,总费用为 \(\$1.25\)。
常见问题
一个 Token 到底是什么?在英文里,大约相当于 ¾ 个单词,或约 4 个字符;中文一般 1 个汉字约占 1~2 个 Token。标点和空格同样会消耗 Token。
输入和输出的单价一样吗?通常不一样——输出 Token 往往比输入 Token 贵 2~4 倍,所以请分别填写两者的单价。
是否包含缓存或批量折扣?不包含。本工具给出的是按官方标价(List Price)的简单估算;如果你享有服务商的专属折扣,请先把折扣后的每千 Token 实际单价填进去。