Mejores modelos de IA · 2026-06-29

Los mejores modelos visión-lenguaje (VLM) 2026

Modelos image-in / text-out para OCR, análisis de capturas UI, lectura de gráficas y revisión de fotos de producto.

Cómo elegimos estos

Entrada de imagen obligatoria; excluimos modelos solo texto.
Precio publicado obligatorio: sin él cuesta más desplegar en producción.
Puntuación = contexto − precio para equilibrar ventana grande y coste.

Top 10 elegidos

1Grok 4 Fast (Reasoning)xAI

$0.180 entrada / $0.450 salida

Contexto: 2M
Proveedores: 7
Llamada a herramientas
Razonamiento
Visión

2X-Ai/Grok-4-Fast-Non-ReasoningxAI

$0.180 entrada / $0.450 salida

Contexto: 2M
Proveedores: 6
Llamada a herramientas
Visión

3Llama 4 Scout 17B Instruct (US)Meta

$0.170 entrada / $0.660 salida

Contexto: 3.50M
Proveedores: 1
Llamada a herramientas
Visión
Pesos abiertos

4Llama 4 Scout 17B InstructMeta

$0.170 entrada / $0.660 salida

Contexto: 3.50M
Proveedores: 1
Llamada a herramientas
Visión
Pesos abiertos

5Grok 4.20 Multi-AgentxAI

$1.25 entrada / $2.50 salida

Contexto: 2M
Proveedores: 6
Salida estructurada
Razonamiento
Visión

6Grok 4.20xAI

$1.25 entrada / $2.50 salida

Contexto: 2M
Proveedores: 4
Llamada a herramientas
Salida estructurada
Razonamiento
Visión

7Gemini 2.0 Flash-LiteGoogle

$0.075 entrada / $0.300 salida

Contexto: 1.05M
Proveedores: 4
Llamada a herramientas
Salida estructurada
Visión

8Gemini 2.5 Flash Lite Preview 09-2025Google

$0.090 entrada / $0.360 salida

Contexto: 1.05M
Proveedores: 6
Llamada a herramientas
Salida estructurada
Razonamiento
Visión

9Coding Xiaomi MiMo-V2.5aihubmix

$0.080 entrada / $0.400 salida

Contexto: 1.05M
Proveedores: 1
Llamada a herramientas
Razonamiento
Visión
Pesos abiertos

10Gemini 2.5 Flash-LiteGoogle

$0.100 entrada / $0.400 salida

Contexto: 1.05M
Proveedores: 17
Llamada a herramientas
Salida estructurada
Razonamiento
Visión

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

Google

Gemini 2.0 Flash-Lite

$0.075 in / $0.300 out · 1.05M ctx

Lowest total per-1M-token cost in this list ($0.38).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

xAI

X-Ai/Grok-4-Fast-Non-Reasoning

$0.180 in / $0.450 out · 2M ctx

Median price ($0.63) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

xAI

Grok 4.20

$1.25 in / $2.50 out · 2M ctx

Highest-priced pick in the list ($3.75) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

aihubmix

Coding Xiaomi MiMo-V2.5

$0.080 in / $0.400 out · 1.05M ctx

Open weights and the cheapest in that subset ($0.48).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

¿Qué modelo de IA es mejor para comprensión de imágenes en 2026?

Ahora mismo ponemos a Grok 4 Fast (Reasoning) de xAI en primer puesto, principalmente porque acepta imágenes como entrada, tiene precio publicado y ofrece la mejor relación contexto / coste de su grupo. El ranking se recalcula a partir de los metadatos del modelo en vivo — consulta «Cómo elegimos estos» arriba para ver la regla exacta.

¿Cuál es la opción más barata de esta lista?

Gemini 2.0 Flash-Lite (Google) es el más barato, a $0.075 por 1M de tokens de entrada y $0.300 por 1M de tokens de salida. El coste de las demás entradas sube a partir de ahí.

¿Cómo se generan estos rankings?

Cada elección sigue una regla programática definida en nuestra configuración use-case-rules: un filtro duro (p. ej. tool calling obligatorio, contexto ≥ 100K) más una puntuación numérica que combina capacidad, ventana de contexto y precio. No reordenamos a mano, pero sí curamos la regla. Los metadatos del modelo se refrescan a diario desde un catálogo canónico normalizado.

¿Con qué frecuencia se actualiza esta página?

Los datos del modelo se refrescan una vez al día y la página estática se reconstruye cuando los datos cambian. La fecha «Última actualización» abajo muestra la última reconstrucción.

Top picks · model details

Grok 4 Fast (Reasoning)$0.18 in / $0.45 out
X-Ai/Grok-4-Fast-Non-Reasoning$0.18 in / $0.45 out
Llama 4 Scout 17B Instruct (US)$0.17 in / $0.66 out
Llama 4 Scout 17B Instruct$0.17 in / $0.66 out
Grok 4.20 Multi-Agent$1.25 in / $2.50 out

Other best-of lists

Browse by capability

Vendors in this list

Tools

Última actualización: 2026-06-29

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Pricing and capabilities are refreshed daily and reconciled against each provider's official documentation. Always verify critical production decisions with the provider directly.