$0.040 вход / $0.160 выход
- Контекст: 131K
- Провайдеры: 33
- Tool Calling
- Структурированный вывод
- Reasoning
- Открытые веса
Лучшие AI-модели · 2026-05-12
Модели с JSON Mode или схемно-ограниченным декодированием; смотрим на реальную парсируемость, а не на «ответь JSON» в промпте.
$0.040 вход / $0.160 выход
$0.950 вход / $4.00 выход
$0.030 вход / $0.140 выход
$0.600 вход / $3.60 выход
$0.300 вход / $2.50 выход
$0.500 вход / $3.00 выход
$0.400 вход / $1.60 выход
$0.150 вход / $0.600 выход
$0.140 вход / $0.280 выход
$0.027 вход / $0.109 выход
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
Сейчас мы ставим GPT OSS 120B от OpenAI на первое место — главным образом потому что она напрямую поддерживает декодирование с ограничением по JSON Schema, а не просто промпт 'отвечай в JSON'. Рейтинг пересчитывается по живым метаданным моделей — точное правило см. в разделе 'Как мы отбирали' выше.
Gemma 3 27B (Google) — самый дешёвый, $0.027 за 1 млн входных токенов и $0.109 за 1 млн выходных токенов. Цены остальных моделей идут выше.
Каждый пункт берётся из программного правила в нашей конфигурации use-case-rules: жёсткий фильтр (например, обязательный Tool Calling, контекст ≥ 100K) плюс численная оценка, объединяющая возможности, контекстное окно и цену. Порядок мы вручную не правим, но сами правила — да. Источник данных — API models.dev, обновляется ежедневно.
Данные модели обновляются раз в сутки из models.dev, а статическая страница пересобирается при изменении данных. Дата 'Последнее обновление' внизу — это последняя сборка.
Последнее обновление:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.