KI‑Modell‑Intelligenz

Beste KI-Modelle · 2026-05-12

Günstigste LLM-APIs 2026

Sortierung nach kombiniertem Preis pro 1 Million Input- und Output-Tokens. Nur offizielle Hauptmodelle mit veröffentlichtem Preis.

Wie wir ausgewählt haben

  • Sortierschlüssel: (input price + output price) je 1M Tokens.
  • Platzhalterpreise von $0 (z. B. Github Copilot Re-Broadcasts oder Free-Tier-Spiegel) werden ausgeschlossen — 'Unknown' bedeutet nicht 'kostenlos'.
  • Nur Textmodelle mit gültigem Kontextfenster (>0 und <50M) werden berücksichtigt, um Datenfehler zu vermeiden.

Top 10 Empfehlungen

1BGE Reranker Basecloudflare-ai-gateway

$0.003 Eingabe / Unknown Ausgabe

  • Kontext: 128K
  • Anbieter: 1

$0.002 Eingabe / $0.002 Ausgabe

  • Kontext: 32K
  • Anbieter: 3
  • Tool Calling
  • Strukturierte Ausgabe
  • Offene Gewichte
4All-MiniLM-L6-v2digitalocean

$0.009 Eingabe / Unknown Ausgabe

  • Kontext: 256
  • Anbieter: 1
  • Offene Gewichte
8BGE Reranker v2 M3digitalocean

$0.010 Eingabe / Unknown Ausgabe

  • Kontext: 8K
  • Anbieter: 1
  • Offene Gewichte
9BGE M3cloudflare-ai-gateway

$0.012 Eingabe / Unknown Ausgabe

  • Kontext: 128K
  • Anbieter: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 Eingabe / Unknown Ausgabe

  • Kontext: 128K
  • Anbieter: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

Welches KI-Modell ist 2026 am besten für den niedrigsten Preis geeignet?

Aktuell setzen wir BGE Reranker Base von cloudflare-ai-gateway an die Spitze, vor allem weil die Summe aus Input- und Output-Preis pro Million Token unter den nicht-platzhalter-bepreisten Modellen am niedrigsten ist. Das Ranking wird automatisch aus Live-Modell-Metadaten neu berechnet — die genaue Regel finden Sie oben unter 'Wie wir ausgewählt haben'.

Was ist die günstigste Option in dieser Liste?

BGE Reranker Base (cloudflare-ai-gateway) ist mit $0.003 pro 1 Mio. Input-Tokens und Unknown pro 1 Mio. Output-Tokens der günstigste Eintrag. Die Preise der übrigen Modelle steigen von dort an.

Wie werden diese Rankings erstellt?

Jeder Eintrag stammt aus einer programmatisch definierten Regel in unserer use-case-rules-Konfiguration: ein Hardfilter (z. B. Tool Calling erforderlich, Kontext ≥ 100K) plus ein numerischer Score, der Funktionsumfang, Kontextfenster und Preis kombiniert. Die Reihenfolge wird nie manuell sortiert, aber die Regel selbst pflegen wir redaktionell. Datenquelle ist die models.dev API, täglich aktualisiert.

Wie oft wird diese Seite aktualisiert?

Die zugrundeliegenden Modelldaten werden einmal täglich aus models.dev aktualisiert, und die statische Seite wird bei Datenänderungen neu erzeugt. Das Datum unter 'Zuletzt aktualisiert' zeigt den jüngsten Build.

Werden Modelle mit 'Unknown'-Preis ausgeschlossen?

Ja. Wir ranken ausschließlich Modelle mit veröffentlichtem Preis pro Million Token. 'Unknown' bedeutet, dass der Anbieter keine öffentliche Preisliste publiziert — das ist nicht dasselbe wie 'kostenlos'. Sie als $0 anzuzeigen wäre irreführend.

Zuletzt aktualisiert:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.