$0.040 Eingabe / $0.160 Ausgabe
- Kontext: 131K
- Anbieter: 33
- Tool Calling
- Strukturierte Ausgabe
- Reasoning
- Offene Gewichte
Beste KI-Modelle · 2026-05-12
Modelle mit nativer Unterstützung für JSON-Schema-Constrained-Decoding oder JSON Mode. Wir bewerten reale Parser-Erfolgsraten, nicht nur einfache 'Antworte in JSON'-Prompts.
$0.040 Eingabe / $0.160 Ausgabe
$0.950 Eingabe / $4.00 Ausgabe
$0.030 Eingabe / $0.140 Ausgabe
$0.600 Eingabe / $3.60 Ausgabe
$0.300 Eingabe / $2.50 Ausgabe
$0.500 Eingabe / $3.00 Ausgabe
$0.400 Eingabe / $1.60 Ausgabe
$0.150 Eingabe / $0.600 Ausgabe
$0.140 Eingabe / $0.280 Ausgabe
$0.027 Eingabe / $0.109 Ausgabe
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Aktuell setzen wir GPT OSS 120B von OpenAI an die Spitze, vor allem weil es JSON-Schema-basiertes Constrained Decoding nativ unterstützt — nicht nur ein einfaches 'Antworte in JSON'-Prompting. Das Ranking wird automatisch aus Live-Modell-Metadaten neu berechnet — die genaue Regel finden Sie oben unter 'Wie wir ausgewählt haben'.
Gemma 3 27B (Google) ist mit $0.027 pro 1 Mio. Input-Tokens und $0.109 pro 1 Mio. Output-Tokens der günstigste Eintrag. Die Preise der übrigen Modelle steigen von dort an.
Jeder Eintrag stammt aus einer programmatisch definierten Regel in unserer use-case-rules-Konfiguration: ein Hardfilter (z. B. Tool Calling erforderlich, Kontext ≥ 100K) plus ein numerischer Score, der Funktionsumfang, Kontextfenster und Preis kombiniert. Die Reihenfolge wird nie manuell sortiert, aber die Regel selbst pflegen wir redaktionell. Datenquelle ist die models.dev API, täglich aktualisiert.
Die zugrundeliegenden Modelldaten werden einmal täglich aus models.dev aktualisiert, und die statische Seite wird bei Datenänderungen neu erzeugt. Das Datum unter 'Zuletzt aktualisiert' zeigt den jüngsten Build.
Zuletzt aktualisiert:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.