Inteligência em modelos de IA

Melhores modelos de IA · 2026-05-12

As APIs de LLM mais baratas 2026

Ordem crescente pelo preço total por milhão de tokens (entrada + saída). Apenas modelos oficiais com preço publicado.

Como selecionamos

  • Chave de ordenação: (preço entrada + preço saída) por 1M tokens.
  • Excluímos $0 placeholder (rebroadcast Copilot, espelhos free tier): “Unknown” não é grátis.
  • Somente modelos de texto com janela válida (>0 e <50M).

Top 10 indicados

1BGE Reranker Basecloudflare-ai-gateway

$0.003 entrada / Unknown saída

  • Contexto: 128K
  • Provedores: 1

$0.002 entrada / $0.002 saída

  • Contexto: 32K
  • Provedores: 3
  • Tool Calling
  • Saída estruturada
  • Pesos abertos
4All-MiniLM-L6-v2digitalocean

$0.009 entrada / Unknown saída

  • Contexto: 256
  • Provedores: 1
  • Pesos abertos
5Qwen3 Embedding 8BAlibaba (Qwen)

$0.010 entrada / Unknown saída

  • Contexto: 33K
  • Provedores: 6
6Qwen3 Embedding 4BAlibaba (Qwen)

$0.010 entrada / Unknown saída

  • Contexto: 33K
  • Provedores: 4
8BGE Reranker v2 M3digitalocean

$0.010 entrada / Unknown saída

  • Contexto: 8K
  • Provedores: 1
  • Pesos abertos
9BGE M3cloudflare-ai-gateway

$0.012 entrada / Unknown saída

  • Contexto: 128K
  • Provedores: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 entrada / Unknown saída

  • Contexto: 128K
  • Provedores: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

Qual modelo de IA é melhor para o menor custo possível em 2026?

Hoje colocamos BGE Reranker Base da cloudflare-ai-gateway no topo, principalmente porque a soma do custo de entrada + saída por milhão de tokens é a mais baixa entre modelos sem preço placeholder. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.

Qual é a opção mais barata desta lista?

BGE Reranker Base (cloudflare-ai-gateway) é a opção mais barata, a $0.003 por 1M de tokens de entrada e Unknown por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.

Como esses rankings são gerados?

Cada seleção vem de uma regra programática definida na nossa configuração use-case-rules: um filtro hard (por exemplo, Tool Calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica combinando capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. A fonte completa é a API models.dev, atualizada diariamente.

Com que frequência esta página é atualizada?

Os dados do modelo são atualizados uma vez por dia a partir do models.dev e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.

Modelos com preço 'Unknown' são excluídos?

Sim. Só classificamos modelos com preço por milhão de tokens publicado. 'Unknown' significa que o provedor não publica uma tabela de preços pública — não é o mesmo que 'gratuito', e mostrá-los a $0 seria enganoso.

Última atualização:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.