$0.040 entrada / $0.160 salida
- Contexto: 131K
- Proveedores: 33
- Llamada a herramientas
- Salida estructurada
- Razonamiento
- Pesos abiertos
Mejores modelos de IA · 2026-05-12
Ranking de modelos con JSON Mode o decodificación restringida por esquema. Valoramos tasas reales de parseo, no solo prompts “responde en JSON”.
$0.040 entrada / $0.160 salida
$0.950 entrada / $4.00 salida
$0.030 entrada / $0.140 salida
$0.600 entrada / $3.60 salida
$0.300 entrada / $2.50 salida
$0.500 entrada / $3.00 salida
$0.400 entrada / $1.60 salida
$0.150 entrada / $0.600 salida
$0.140 entrada / $0.280 salida
$0.027 entrada / $0.109 salida
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Ahora mismo ponemos a GPT OSS 120B de OpenAI en primer puesto, principalmente porque soporta explícitamente la decodificación restringida por JSON Schema, no solo el típico 'responde en JSON'. El ranking se recalcula a partir de los metadatos del modelo en vivo — consulta «Cómo elegimos estos» arriba para ver la regla exacta.
Gemma 3 27B (Google) es el más barato, a $0.027 por 1M de tokens de entrada y $0.109 por 1M de tokens de salida. El coste de las demás entradas sube a partir de ahí.
Cada selección proviene de una regla programática definida en nuestra configuración use-case-rules: un filtro duro (por ejemplo, llamada a herramientas obligatoria, contexto ≥ 100K) más una puntuación numérica que combina capacidad, ventana de contexto y precio. No reordenamos a mano, pero sí curamos la regla. La fuente de datos completa es la API de models.dev, refrescada a diario.
Los datos del modelo se refrescan una vez al día desde models.dev y la página estática se reconstruye cuando los datos cambian. La fecha «Última actualización» abajo muestra la última reconstrucción.
Última actualización:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.