Công cụ tính chi phí Token AI/LLM là gì?
Hầu hết các API mô hình ngôn ngữ lớn (LLM) — như của OpenAI, Anthropic, Google và nhiều nhà cung cấp khác — đều tính phí theo token, với mức giá riêng cho token đầu vào (prompt) và token đầu ra (completion). Giá thường được niêm yết theo mỗi 1.000 token (hoặc mỗi triệu token). Công cụ này quy đổi những mức giá đó thành con số bằng đô la rõ ràng, giúp bạn lập ngân sách cho một tính năng, so sánh các mô hình, hoặc dự báo chi phí cho khối lượng công việc thực tế trước khi triển khai. Lưu ý: giá API thường được niêm yết bằng USD; nếu thanh toán bằng VND, bạn cần quy đổi theo tỷ giá hiện hành.
Cách sử dụng
Nhập số token đầu vào và token đầu ra cho một yêu cầu điển hình, sau đó nhập giá mỗi 1.000 token cho từng loại. Bạn có thể nhập thêm số lần gọi để mở rộng ước tính cho toàn bộ khối lượng công việc (tùy chọn). Công cụ sẽ trả về chi phí mỗi lần gọi và tổng chi phí, được tách rõ thành phần đầu vào và phần đầu ra.
Giải thích công thức
Chi phí cho một lần gọi được tính như sau:
$$\text{chi phí} = \frac{\text{token\_đầu\_vào}}{1000}\times \text{giá\_đầu\_vào} + \frac{\text{token\_đầu\_ra}}{1000}\times \text{giá\_đầu\_ra}$$
Mỗi số lượng token được chia cho 1.000 vì giá được niêm yết theo mỗi 1.000 token. Token đầu ra thường đắt hơn token đầu vào, đó là lý do chúng được tính giá riêng. Tổng chi phí đơn giản là chi phí mỗi lần gọi nhân với số lần gọi.
Ví dụ minh họa
Giả sử một yêu cầu sử dụng 1.000 token đầu vào với giá 0,0015 USD mỗi 1.000 token và tạo ra 500 token đầu ra với giá 0,002 USD mỗi 1.000 token. Chi phí đầu vào \(= (1000/1000) \times 0{,}0015 = 0{,}0015\) USD. Chi phí đầu ra \(= (500/1000) \times 0{,}002 = 0{,}001\) USD. Chi phí mỗi lần gọi \(= 0{,}0025\) USD. Nếu thực hiện 10.000 lượt gọi như vậy, tổng chi phí là 25,00 USD.
Tham Khảo Giá LLM Hiện Tại (cho mỗi 1K Token)
Bảng dưới đây liệt kê các giá API được công bố phổ biến cho các mô hình ngôn ngữ lớn phổ biến, được tính cho mỗi 1.000 token (1K) tính bằng đô la Mỹ. Nhiều nhà cung cấp công bố tỷ giá của họ cho mỗi 1.000.000 token (1M); để chuyển đổi, hãy chia giá theo 1M cho 1.000. Ví dụ: một mô hình được định giá $5,00 cho mỗi 1 triệu token đầu vào có chi phí $0,005 cho mỗi 1K token đầu vào.
| Mô hình | Đầu vào ($/1K) | Đầu ra ($/1K) |
|---|---|---|
| GPT-4o | $0.0025 | $0.010 |
| GPT-4o mini | $0.00015 | $0.0006 |
| GPT-3.5 Turbo | $0.0005 | $0.0015 |
| Claude 3.5 Sonnet | $0.003 | $0.015 |
| Claude 3 Haiku | $0.00025 | $0.00125 |
| Gemini 1.5 Pro | $0.00125 | $0.005 |
| Gemini 1.5 Flash | $0.000075 | $0.0003 |
Lưu ý: Giá LLM thay đổi thường xuyên, khác nhau theo khu vực và cấp độ (ví dụ: chiết khấu ngữ cảnh dài, lô hoặc đầu vào được lưu trong bộ nhớ đệm), và có thể khác nhau đối với các mô hình được tinh chỉnh. Luôn xác minh tỷ giá hiện tại trên trang định giá chính thức của nhà cung cấp trước khi lập ngân sách. Các giá trị trên là các số liệu tham khảo đại diện để cắm vào máy tính, không phải là báo giá được đảm bảo.
Các Thuật Ngữ Chính Được Giải Thích
- Token
- Đơn vị cơ bản của văn bản mà LLM xử lý. Một token là khoảng 4 ký tự hoặc khoảng ¾ của một từ trong tiếng Anh, vì vậy 1.000 token xấp xỉ 750 từ. Các mô hình tính phí theo token, không phải từ hoặc ký tự.
- Token đầu vào (prompt)
- Tất cả các token bạn gửi đến mô hình trong một yêu cầu — hướng dẫn của bạn, lịch sử cuộc trò chuyện, lời nhắc hệ thống và bất kỳ ngữ cảnh nào được truy xuất. Các token này được tính phí theo tỷ giá đầu vào.
- Token đầu ra (completion)
- Các token mà mô hình tạo ra trong câu trả lời của nó. Những token này được tính phí theo tỷ giá đầu ra, thường cao hơn tỷ giá đầu vào (thường là 3–4×), vì vậy các phản hồi dài hơn có chi phí cao hơn không tương xứng.
- Giá định theo 1K so với 1M
- Hai cách tương đương để trích dẫn cùng một giá. Tỷ giá $5,00 cho mỗi 1.000.000 token bằng $0,005 cho mỗi 1.000 token. Chia giá theo 1M cho 1.000 để có được giá theo 1K mà máy tính này sử dụng.
- Cửa sổ ngữ cảnh
- Số token tối đa (đầu vào cộng với đầu ra) mà một mô hình có thể xử lý trong một yêu cầu duy nhất — ví dụ 128K hoặc 1M token. Nó giới hạn bao nhiêu bạn có thể gửi và nhận trên mỗi cuộc gọi nhưng bản thân nó không thay đổi giá theo từng token.
- Cuộc gọi / yêu cầu
- Một vòng đi/về với API: bạn gửi token đầu vào và nhận token đầu ra. Tổng chi phí là chi phí của một cuộc gọi nhân với số lần cuộc gọi bạn thực hiện.
Câu hỏi thường gặp
Nhà cung cấp của tôi niêm yết giá theo mỗi triệu token — tôi nên nhập con số nào? Hãy chia giá mỗi triệu token cho 1.000 để ra giá mỗi 1.000 token (ví dụ: 1,50 USD/1 triệu = 0,0015 USD/1.000 token).
Làm sao để ước tính số lượng token? Một quy tắc ước chừng là khoảng 4 ký tự hoặc khoảng 0,75 từ cho mỗi token trong tiếng Anh; với tiếng Việt tỷ lệ có thể khác. Để chính xác, hãy dùng bộ đếm token (tokenizer) của nhà cung cấp.
Công cụ này đã bao gồm các khoản phí khác chưa? Chưa — công cụ chỉ tính chi phí dựa trên token. Các khoản phí tinh chỉnh (fine-tuning), hình ảnh, âm thanh hay lưu trữ được tính riêng.