$0.040 entrée / $0.160 sortie
- Contexte: 131K
- Fournisseurs: 33
- Tool Calling
- Sortie structurée
- Raisonnement
- Poids ouverts
Meilleurs modèles d'IA · 2026-05-12
Classement des modèles avec JSON Mode ou décodage guidé par schéma ; on mesure les taux de parsing réels, pas seulement le prompting.
$0.040 entrée / $0.160 sortie
$0.950 entrée / $4.00 sortie
$0.030 entrée / $0.140 sortie
$0.600 entrée / $3.60 sortie
$0.300 entrée / $2.50 sortie
$0.500 entrée / $3.00 sortie
$0.400 entrée / $1.60 sortie
$0.150 entrée / $0.600 sortie
$0.140 entrée / $0.280 sortie
$0.027 entrée / $0.109 sortie
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Actuellement, nous plaçons GPT OSS 120B de OpenAI en tête, principalement parce que il prend en charge le décodage contraint par schéma JSON, pas seulement le simple 'réponds en JSON'. Le classement est recalculé à partir des métadonnées en temps réel — voir « Méthode de sélection » ci-dessus pour la règle exacte.
Gemma 3 27B (Google) est l'entrée la moins chère, à $0.027 par million de tokens d'entrée et $0.109 par million de tokens de sortie. Le coût des autres entrées augmente à partir de là.
Chaque sélection provient d'une règle programmatique définie dans notre configuration use-case-rules : un filtre dur (par exemple Tool Calling requis, contexte ≥ 100K) plus un score numérique combinant capacité, fenêtre de contexte et prix. Nous ne réordonnons jamais à la main, mais nous maintenons les règles. La source complète est l'API models.dev, rafraîchie quotidiennement.
Les données sous-jacentes sont rafraîchies une fois par jour depuis models.dev, et la page statique est régénérée lorsque les données changent. La date « Dernière mise à jour » ci-dessous indique le dernier build.
Dernière mise à jour :
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.