$0.072 entrada / $0.287 saída
- Contexto: 10M
- Provedores: 2
- Tool Calling
Melhores modelos de IA · 2026-06-29
Modelos para RAG, leitura de documentos extensos, análise de monorepos e revisões multiarquivo.
$0.072 entrada / $0.287 saída
$0.170 entrada / $0.660 saída
$0.170 entrada / $0.660 saída
$0.180 entrada / $0.450 saída
$0.180 entrada / $0.450 saída
$1.25 entrada / $2.50 saída
$1.25 entrada / $2.50 saída
$0.200 entrada / $0.500 saída
$2.50 entrada / $15.00 saída
$5.00 entrada / $30.00 saída
$30.00 entrada / $180.00 saída
$30.00 entrada / $180.00 saída
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.36).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($3.75) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($210.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
Open weights and the cheapest in that subset ($0.83).
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Hoje colocamos Qwen Long da Alibaba (Qwen) no topo, principalmente porque aceita o maior número de tokens em uma única requisição e ainda publica preço para a janela completa. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.
Qwen Long (Alibaba (Qwen)) é a opção mais barata, a $0.072 por 1M de tokens de entrada e $0.287 por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.
Cada escolha segue uma regra programática definida na nossa configuração use-case-rules: um filtro rígido (ex.: tool calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica que combina capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. Os metadados do modelo são atualizados diariamente a partir de um catálogo canônico normalizado.
Os dados do modelo são atualizados uma vez por dia e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.
Última atualização:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Pricing and capabilities are refreshed daily and reconciled against each provider's official documentation. Always verify critical production decisions with the provider directly.