$2.50 entrada / $15.00 salida
- Contexto: 1.05M
- Proveedores: 19
- Llamada a herramientas
- Salida estructurada
- Razonamiento
- Visión
Mejores modelos de IA · 2026-05-12
Modelos que combinan tool calling, salida estructurada y razonamiento multietapa. El ranking pondera el “trío agente” típico de stacks productivos.
$2.50 entrada / $15.00 salida
$5.00 entrada / $30.00 salida
$30.00 entrada / $180.00 salida
$1.74 entrada / $3.48 salida
$0.140 entrada / $0.280 salida
$16.50 entrada / $82.50 salida
$5.00 entrada / $25.00 salida
$5.00 entrada / $25.00 salida
$5.00 entrada / $25.00 salida
$3.30 entrada / $16.50 salida
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.42).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($30.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($210.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Ahora mismo ponemos a GPT-5.4 de OpenAI en primer puesto, principalmente porque obtiene la puntuación más alta en la tríada de agentes — llamada a herramientas, salida estructurada y razonamiento — con un límite de tokens de salida usable. El ranking se recalcula a partir de los metadatos del modelo en vivo — consulta «Cómo elegimos estos» arriba para ver la regla exacta.
DeepSeek V4 Flash (DeepSeek) es el más barato, a $0.140 por 1M de tokens de entrada y $0.280 por 1M de tokens de salida. El coste de las demás entradas sube a partir de ahí.
Cada selección proviene de una regla programática definida en nuestra configuración use-case-rules: un filtro duro (por ejemplo, llamada a herramientas obligatoria, contexto ≥ 100K) más una puntuación numérica que combina capacidad, ventana de contexto y precio. No reordenamos a mano, pero sí curamos la regla. La fuente de datos completa es la API de models.dev, refrescada a diario.
Los datos del modelo se refrescan una vez al día desde models.dev y la página estática se reconstruye cuando los datos cambian. La fecha «Última actualización» abajo muestra la última reconstrucción.
Los flujos de coding y de agentes casi siempre necesitan invocar herramientas externas — el editor, una shell, un test runner, una base de datos. Sin function calling de primera clase, hay que parsear texto libre que el modelo emite, lo que es frágil en producción.
Última actualización:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.