$0.040 entrada / $0.160 saída
- Contexto: 131K
- Provedores: 33
- Tool Calling
- Saída estruturada
- Raciocínio
- Pesos abertos
Melhores modelos de IA · 2026-05-12
Ranking de modelos com JSON Mode ou decodificação guiada por esquema. Avaliamos taxa real de parse, não só prompt “responda em JSON”.
$0.040 entrada / $0.160 saída
$0.950 entrada / $4.00 saída
$0.030 entrada / $0.140 saída
$0.600 entrada / $3.60 saída
$0.300 entrada / $2.50 saída
$0.500 entrada / $3.00 saída
$0.400 entrada / $1.60 saída
$0.150 entrada / $0.600 saída
$0.140 entrada / $0.280 saída
$0.027 entrada / $0.109 saída
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Hoje colocamos GPT OSS 120B da OpenAI no topo, principalmente porque suporta explicitamente decodificação restrita por JSON Schema, não apenas o típico 'responda em JSON'. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.
Gemma 3 27B (Google) é a opção mais barata, a $0.027 por 1M de tokens de entrada e $0.109 por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.
Cada seleção vem de uma regra programática definida na nossa configuração use-case-rules: um filtro hard (por exemplo, Tool Calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica combinando capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. A fonte completa é a API models.dev, atualizada diariamente.
Os dados do modelo são atualizados uma vez por dia a partir do models.dev e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.
Última atualização:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.