什麼是 Token 換算字數與費用計算機?
GPT、Claude、Gemini 等大型語言模型(LLM)處理文字時,是以 token(詞元)為單位,而非以「字」或「單字」為單位。一個 token 是一小段文字,通常約等於四個字元的單字片段。這個計算機可以幫你估算特定的 token 數量大約相當於多少英文單字,並依照模型每 1,000 tokens 的單價,算出這些 token 的花費。
如何使用
輸入 token 數量、每個 token 對應的單字比例(英文文章建議使用預設值 0.75),以及你的供應商每 1,000 tokens 收取的價格。工具會立即回傳預估的單字數與美元費用。
公式說明
單字估算使用 單字數 ≈ tokens × 0.75,這對應到常見的經驗法則:1,000 tokens 大約等於 750 個英文單字。費用則為 (tokens ÷ 1000) × 每 1,000 tokens 單價,因為供應商通常以每千個 token 計費。若處理的是其他語言或程式碼,由於每個單字往往會佔用更多 token,建議自行調整這個比例。
實際範例
假設你有 1,000 個 tokens,比例設定為 0.75,價格為每 1,000 tokens 0.50 美元。單字數 = 750 個單字:
$$\text{單字數} = 1{,}000 \times 0.75 = 750$$費用 = $0.50:
$$\text{費用} = \frac{1{,}000}{1{,}000} \times \$0.50 = \$0.50$$常見問題
單字估算的準確度如何? 這只是一個近似值。實際的 tokenization(分詞方式)會因模型與內容而異;以英文來說,0.75 單字/token 是相當可靠的平均值。
輸入與輸出的 token 費用相同嗎? 不一定——許多供應商對輸入和輸出採用不同費率。你可以分別用兩種費率各算一次,再把結果加總起來。
為什麼程式碼或非英文文字會有差異? 它們通常每個單字會用到更多 token,因此建議調低比例(例如 0.5)以得到更準確的估算。