Qu'est-ce que le calculateur de coût d'API LLM ?
Cet outil estime combien vous coûtera l'appel d'une API de grand modèle de langage (LLM) comme GPT, Claude ou Gemini. Les fournisseurs facturent au token, et appliquent généralement un tarif différent pour les tokens que vous envoyez (l'entrée, ou prompt) et pour ceux que le modèle génère (la sortie, ou complétion). Les prix sont le plus souvent annoncés par tranche de 1 000 ou de 1 000 000 de tokens — ce calculateur raisonne par tranche de 1 000 (1K) tokens. À noter : les tarifs des fournisseurs sont presque toujours libellés en dollars américains ($), quelle que soit votre localisation.
Comment l'utiliser
Saisissez le nombre de tokens d'entrée et de tokens de sortie pour une seule requête, puis le prix par 1 000 tokens pour chacun. Indiquez ensuite le nombre de requêtes identiques que vous prévoyez d'exécuter. Le calculateur affiche le coût d'une requête, la répartition entre coût d'entrée et coût de sortie, ainsi que la dépense totale estimée.
Astuce : si votre fournisseur affiche ses prix par million de tokens, divisez ce chiffre par 1 000 pour obtenir le prix par tranche de 1K (par exemple, 0,50 $ par million = 0,0005 $ par 1K).
La formule expliquée
L'équation de base est la suivante : $$\text{Coût} = \left( \frac{\text{tokens\_entrée}}{1000} \times \text{prix\_entrée} + \frac{\text{tokens\_sortie}}{1000} \times \text{prix\_sortie} \right)$$. Diviser le nombre de tokens par 1 000 convertit un volume brut en « milliers de tokens », que l'on multiplie ensuite par le tarif par 1K. La somme des deux produits donne le coût d'une seule requête ; on multiplie enfin ce résultat par le nombre de requêtes pour obtenir la dépense totale.
Exemple concret
Imaginons une requête utilisant 1 000 tokens d'entrée à 0,0005 $ par 1K et 500 tokens de sortie à 0,0015 $ par 1K. Coût d'entrée = \((1000/1000) \times 0{,}0005 = 0{,}0005\) $. Coût de sortie = \((500/1000) \times 0{,}0015 = 0{,}00075\) $. Coût par requête = 0,00125 $. Sur 1 000 requêtes, le total atteint 1,25 $.
Questions fréquentes
Qu'est-ce qu'un token au juste ? En anglais, cela correspond grossièrement à ¾ d'un mot, soit environ 4 caractères. La ponctuation et les espaces consomment eux aussi des tokens. En français, le découpage peut différer légèrement selon le modèle.
L'entrée et la sortie sont-elles facturées au même prix ? En général, non — les tokens de sortie coûtent souvent 2 à 4 fois plus cher que ceux d'entrée. Saisissez donc bien les deux tarifs séparément.
Cela tient-il compte du cache ou des remises par lot (batch) ? Non. Il s'agit d'une simple estimation au tarif catalogue ; appliquez d'abord les remises propres à votre fournisseur à vos prix effectifs par 1K.