Melhores modelos de IA · 2026-06-29

Os melhores modelos visão-linguagem (VLM) 2026

Modelos image-in / text-out para OCR, análise de screenshots, leitura de gráficos e fotos de produto.

Como selecionamos

Entrada de imagem obrigatória; excluímos apenas texto.
Preço publicado obrigatório: sem ele o deploy produtivo fica mais difícil.
Pontuação = contexto − preço para balancear janela grande e custo.

Top 10 indicados

1Grok 4 Fast (Reasoning)xAI

$0.180 entrada / $0.450 saída

Contexto: 2M
Provedores: 7
Tool Calling
Raciocínio
Visão

2X-Ai/Grok-4-Fast-Non-ReasoningxAI

$0.180 entrada / $0.450 saída

Contexto: 2M
Provedores: 6
Tool Calling
Visão

3Llama 4 Scout 17B Instruct (US)Meta

$0.170 entrada / $0.660 saída

Contexto: 3.50M
Provedores: 1
Tool Calling
Visão
Pesos abertos

4Llama 4 Scout 17B InstructMeta

$0.170 entrada / $0.660 saída

Contexto: 3.50M
Provedores: 1
Tool Calling
Visão
Pesos abertos

5Grok 4.20 Multi-AgentxAI

$1.25 entrada / $2.50 saída

Contexto: 2M
Provedores: 6
Saída estruturada
Raciocínio
Visão

6Grok 4.20xAI

$1.25 entrada / $2.50 saída

Contexto: 2M
Provedores: 4
Tool Calling
Saída estruturada
Raciocínio
Visão

7Gemini 2.0 Flash-LiteGoogle

$0.075 entrada / $0.300 saída

Contexto: 1.05M
Provedores: 4
Tool Calling
Saída estruturada
Visão

8Gemini 2.5 Flash Lite Preview 09-2025Google

$0.090 entrada / $0.360 saída

Contexto: 1.05M
Provedores: 6
Tool Calling
Saída estruturada
Raciocínio
Visão

9Coding Xiaomi MiMo-V2.5aihubmix

$0.080 entrada / $0.400 saída

Contexto: 1.05M
Provedores: 1
Tool Calling
Raciocínio
Visão
Pesos abertos

10Gemini 2.5 Flash-LiteGoogle

$0.100 entrada / $0.400 saída

Contexto: 1.05M
Provedores: 17
Tool Calling
Saída estruturada
Raciocínio
Visão

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

Google

Gemini 2.0 Flash-Lite

$0.075 in / $0.300 out · 1.05M ctx

Lowest total per-1M-token cost in this list ($0.38).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

xAI

X-Ai/Grok-4-Fast-Non-Reasoning

$0.180 in / $0.450 out · 2M ctx

Median price ($0.63) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

xAI

Grok 4.20

$1.25 in / $2.50 out · 2M ctx

Highest-priced pick in the list ($3.75) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

aihubmix

Coding Xiaomi MiMo-V2.5

$0.080 in / $0.400 out · 1.05M ctx

Open weights and the cheapest in that subset ($0.48).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

Qual modelo de IA é melhor para compreensão de imagens em 2026?

Hoje colocamos Grok 4 Fast (Reasoning) da xAI no topo, principalmente porque aceita imagens como entrada, tem preço publicado e oferece a melhor relação contexto / custo do grupo. O ranking é recalculado a partir dos metadados do modelo em tempo real — veja 'Como selecionamos' acima para a regra exata.

Qual é a opção mais barata desta lista?

Gemini 2.0 Flash-Lite (Google) é a opção mais barata, a $0.075 por 1M de tokens de entrada e $0.300 por 1M de tokens de saída. O custo das demais entradas sobe a partir daí.

Como esses rankings são gerados?

Cada escolha segue uma regra programática definida na nossa configuração use-case-rules: um filtro rígido (ex.: tool calling obrigatório, contexto ≥ 100K) mais uma pontuação numérica que combina capacidade, janela de contexto e preço. Nunca reordenamos manualmente, mas curamos a regra. Os metadados do modelo são atualizados diariamente a partir de um catálogo canônico normalizado.

Com que frequência esta página é atualizada?

Os dados do modelo são atualizados uma vez por dia e a página estática é reconstruída quando os dados mudam. A data 'Última atualização' abaixo mostra a build mais recente.

Top picks · model details

Grok 4 Fast (Reasoning)$0.18 in / $0.45 out
X-Ai/Grok-4-Fast-Non-Reasoning$0.18 in / $0.45 out
Llama 4 Scout 17B Instruct (US)$0.17 in / $0.66 out
Llama 4 Scout 17B Instruct$0.17 in / $0.66 out
Grok 4.20 Multi-Agent$1.25 in / $2.50 out

Other best-of lists

Browse by capability

Vendors in this list

Tools

Última atualização: 2026-06-29

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Pricing and capabilities are refreshed daily and reconciled against each provider's official documentation. Always verify critical production decisions with the provider directly.