Inteligencia de modelos de IA

Mejores modelos de IA · 2026-05-12

Las APIs de LLM más baratas 2026

Orden ascendente por precio total por millón de tokens (entrada + salida). Solo modelos oficiales con precio publicado.

Cómo elegimos estos

  • Clave de orden: (precio entrada + precio salida) por 1M tokens.
  • Excluimos $0 marcador (Copilot rebroadcast, espejos free tier): “Unknown” no es gratis.
  • Solo modelos de texto con ventana de contexto válida (>0 y <50M).

Top 10 elegidos

1BGE Reranker Basecloudflare-ai-gateway

$0.003 entrada / Unknown salida

  • Contexto: 128K
  • Proveedores: 1

$0.002 entrada / $0.002 salida

  • Contexto: 32K
  • Proveedores: 3
  • Llamada a herramientas
  • Salida estructurada
  • Pesos abiertos
4All-MiniLM-L6-v2digitalocean

$0.009 entrada / Unknown salida

  • Contexto: 256
  • Proveedores: 1
  • Pesos abiertos
5Qwen3 Embedding 8BAlibaba (Qwen)

$0.010 entrada / Unknown salida

  • Contexto: 33K
  • Proveedores: 6
6Qwen3 Embedding 4BAlibaba (Qwen)

$0.010 entrada / Unknown salida

  • Contexto: 33K
  • Proveedores: 4
8BGE Reranker v2 M3digitalocean

$0.010 entrada / Unknown salida

  • Contexto: 8K
  • Proveedores: 1
  • Pesos abiertos
9BGE M3cloudflare-ai-gateway

$0.012 entrada / Unknown salida

  • Contexto: 128K
  • Proveedores: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 entrada / Unknown salida

  • Contexto: 128K
  • Proveedores: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

¿Qué modelo de IA es mejor para el menor coste posible en 2026?

Ahora mismo ponemos a BGE Reranker Base de cloudflare-ai-gateway en primer puesto, principalmente porque la suma de coste de entrada + salida por millón de tokens es la más baja entre modelos sin precio placeholder. El ranking se recalcula a partir de los metadatos del modelo en vivo — consulta «Cómo elegimos estos» arriba para ver la regla exacta.

¿Cuál es la opción más barata de esta lista?

BGE Reranker Base (cloudflare-ai-gateway) es el más barato, a $0.003 por 1M de tokens de entrada y Unknown por 1M de tokens de salida. El coste de las demás entradas sube a partir de ahí.

¿Cómo se generan estos rankings?

Cada selección proviene de una regla programática definida en nuestra configuración use-case-rules: un filtro duro (por ejemplo, llamada a herramientas obligatoria, contexto ≥ 100K) más una puntuación numérica que combina capacidad, ventana de contexto y precio. No reordenamos a mano, pero sí curamos la regla. La fuente de datos completa es la API de models.dev, refrescada a diario.

¿Con qué frecuencia se actualiza esta página?

Los datos del modelo se refrescan una vez al día desde models.dev y la página estática se reconstruye cuando los datos cambian. La fecha «Última actualización» abajo muestra la última reconstrucción.

¿Se excluyen los modelos con precio «Unknown»?

Sí. Solo clasificamos modelos con precio por millón de tokens publicado. «Unknown» significa que el proveedor no publica una tarifa pública — no equivale a «gratis», y mostrarlos a $0 sería engañoso.

Última actualización:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.