$2.50 entrada / $15.00 saída
- Contexto: 1.05M
- Provedores: 30
- Tool Calling
- Saída estruturada
- Raciocínio
- Visão
Melhores modelos de IA · 2026-06-29
Seleção para agentes de código (Cursor, Copilot, Claude Code). Priorizamos tool calling, contexto longo e saída estruturada estável.
$2.50 entrada / $15.00 saída
$5.00 entrada / $30.00 saída
$1.25 entrada / $10.00 saída
$0.300 entrada / $2.50 saída
$0.500 entrada / $3.00 saída
$2.00 entrada / $12.00 saída
$0.100 entrada / $0.400 saída
$1.50 entrada / $9.00 saída
$0.435 entrada / $0.870 saída
$1.40 entrada / $4.40 saída
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.50).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($10.50) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($35.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
Open weights and the cheapest in that subset ($1.30).
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Hoje colocamos GPT-5.4 da OpenAI no topo, principalmente porque combina Tool Calling, saída estruturada e janela de contexto grande o suficiente para arquivos-fonte reais. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.
Gemini 2.5 Flash-Lite (Google) é a opção mais barata, a $0.100 por 1M de tokens de entrada e $0.400 por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.
Cada escolha segue uma regra programática definida na nossa configuração use-case-rules: um filtro rígido (ex.: tool calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica que combina capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. Os metadados do modelo são atualizados diariamente a partir de um catálogo canônico normalizado.
Os dados do modelo são atualizados uma vez por dia e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.
Workflows de coding e de agentes quase sempre precisam invocar ferramentas externas — o editor, um shell, um test runner, um banco de dados. Sem function calling de primeira classe, é necessário fazer parsing de texto livre emitido pelo modelo, o que é frágil em produção.
Última atualização:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Pricing and capabilities are refreshed daily and reconciled against each provider's official documentation. Always verify critical production decisions with the provider directly.