$0.072 entrada / $0.287 saída
- Contexto: 10M
- Provedores: 2
- Tool Calling
Melhores modelos de IA · 2026-05-12
Modelos para RAG, leitura de documentos extensos, análise de monorepos e revisões multiarquivo.
$0.072 entrada / $0.287 saída
$0.170 entrada / $0.660 saída
$0.170 entrada / $0.660 saída
$0.200 entrada / $0.500 saída
$0.200 entrada / $0.500 saída
$0.180 entrada / $0.450 saída
$0.200 entrada / $0.500 saída
$0.200 entrada / $0.500 saída
$1.42 entrada / $2.83 saída
$2.00 entrada / $6.00 saída
$2.00 entrada / $6.00 saída
$2.00 entrada / $6.00 saída
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.36).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($0.83) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($8.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Hoje colocamos Qwen Long da Alibaba (Qwen) no topo, principalmente porque aceita o maior número de tokens em uma única requisição e ainda publica preço para a janela completa. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.
Qwen Long (Alibaba (Qwen)) é a opção mais barata, a $0.072 por 1M de tokens de entrada e $0.287 por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.
Cada seleção vem de uma regra programática definida na nossa configuração use-case-rules: um filtro hard (por exemplo, Tool Calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica combinando capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. A fonte completa é a API models.dev, atualizada diariamente.
Os dados do modelo são atualizados uma vez por dia a partir do models.dev e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.
Última atualização:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.