Что такое калькулятор стоимости токенов AI/LLM?
Большинство API больших языковых моделей (LLM) — от OpenAI, Anthropic, Google и других — берут плату за токены, причём по отдельным ставкам для входных токенов (промпта) и выходных токенов (ответа модели). Цены обычно указывают за 1000 токенов (либо за миллион). Этот калькулятор переводит такие ставки в понятную сумму в долларах, чтобы вы могли спланировать бюджет новой функции, сравнить модели или спрогнозировать нагрузку в продакшене ещё до запуска.
Как пользоваться
Укажите количество входных токенов и выходных токенов для типичного запроса, а затем цену за 1000 токенов для каждого типа. При желании введите число вызовов, чтобы масштабировать оценку на всю нагрузку. Калькулятор покажет стоимость одного запроса и итоговую сумму с разбивкой на входную и выходную части.
Разбор формулы
Стоимость одного вызова рассчитывается так:
$$\text{стоимость} = \frac{\text{входные\_токены}}{1000}\times \text{цена\_входа} + \frac{\text{выходные\_токены}}{1000}\times \text{цена\_выхода}$$
Каждое количество токенов делится на 1000, потому что цены указываются за 1К токенов. Выходные токены, как правило, дороже входных — именно поэтому для них задаётся отдельная цена. Итоговая сумма — это просто стоимость одного вызова, умноженная на число вызовов.
Пример расчёта
Допустим, запрос использует 1000 входных токенов по $0,0015 за 1К и выдаёт 500 выходных токенов по $0,002 за 1К. Стоимость входа = \((1000/1000) \times 0{,}0015 = \$0{,}0015\). Стоимость выхода = \((500/1000) \times 0{,}002 = \$0{,}001\). Стоимость одного вызова = $0,0025. Если выполнить 10 000 таких вызовов, итог составит $25,00.
Частые вопросы
Провайдер указывает цену за миллион токенов — что вводить? Разделите цену за миллион на 1000, чтобы получить цену за 1К (например, $1,50 за 1М = $0,0015 за 1К).
Как оценить количество токенов? Грубое правило: примерно 4 символа или около 0,75 слова на токен в английском тексте. Для точного результата используйте токенизатор вашего провайдера. Учтите, что для русского текста токенов обычно требуется больше.
Учитываются ли другие платежи? Нет — расчёт охватывает только оплату по токенам. Дообучение (fine-tuning), обработка изображений, аудио и хранение данных тарифицируются отдельно.
Справочник текущих цен на LLM (за 1K токенов)
В таблице ниже представлены обычно опубликованные цены API для популярных больших языковых моделей, выраженные за 1000 токенов (1K) в долларах США. Многие поставщики публикуют свои тарифы за 1 000 000 токенов (1M); для преобразования разделите цену за 1M на 1000. Например, если модель стоит $5,00 за 1M входных токенов, то это стоит $0,005 за 1K входных токенов.
| Модель | Входные ($/1K) | Выходные ($/1K) |
|---|---|---|
| GPT-4o | $0.0025 | $0.010 |
| GPT-4o mini | $0.00015 | $0.0006 |
| GPT-3.5 Turbo | $0.0005 | $0.0015 |
| Claude 3.5 Sonnet | $0.003 | $0.015 |
| Claude 3 Haiku | $0.00025 | $0.00125 |
| Gemini 1.5 Pro | $0.00125 | $0.005 |
| Gemini 1.5 Flash | $0.000075 | $0.0003 |
Примечание: цены на LLM часто меняются, различаются по регионам и уровням (например, скидки за длинный контекст, пакетную обработку или кэшированный ввод) и могут отличаться для тонко настроенных моделей. Всегда проверяйте актуальный тариф на официальной странице цен поставщика перед составлением бюджета. Значения выше являются репрезентативными справочными цифрами для использования в калькуляторе, а не гарантированным предложением.
Объяснение ключевых терминов
- Токен
- Базовая единица текста, которую обрабатывает LLM. Токен — это примерно 4 символа или около ¾ слова на английском языке, поэтому 1000 токенов составляют примерно 750 слов. Модели выставляют счета по токенам, а не по словам или символам.
- Входные (подсказка) токены
- Все токены, которые вы отправляете модели в запросе — ваши инструкции, историю разговора, системную подсказку и любой извлечённый контекст. Они взимаются по входной цене.
- Выходные (завершение) токены
- Токены, которые модель генерирует в своём ответе. Они выставляются по выходной цене, которая обычно выше входной цены (часто в 3–4 раза), поэтому более длинные ответы стоят непропорционально дороже.
- Тарификация за 1K и за 1M
- Два эквивалентных способа цитирования одной и той же цены. Тариф $5,00 за 1 000 000 токенов равен $0,005 за 1000 токенов. Разделите цену за 1M на 1000, чтобы получить цену за 1K, которую использует этот калькулятор.
- Контекстное окно
- Максимальное количество токенов (входных плюс выходных), которое модель может обработать в одном запросе — например, 128K или 1M токенов. Это ограничивает объём, который вы можете отправить и получить за один вызов, но само по себе не изменяет цену за токен.
- Вызов / запрос
- Один цикл туда и обратно к API: вы отправляете входные токены и получаете выходные токены. Общие расходы — это стоимость одного вызова, умноженная на количество вызовов, которые вы выполняете.