$2.50 输入 / $15.00 输出
- 上下文: 1.05M
- 服务商: 19
- 工具调用
- 结构化输出
- 推理
- 视觉
AI 模型推荐 · 2026-05-12
组合了 Tool calling、结构化输出与多步推理能力的模型,是搭建生产 Agent 的核心选项。本榜单按这套 'Agent 三件套' 加权排序。
$2.50 输入 / $15.00 输出
$5.00 输入 / $30.00 输出
$30.00 输入 / $180.00 输出
$1.74 输入 / $3.48 输出
$0.140 输入 / $0.280 输出
$16.50 输入 / $82.50 输出
$5.00 输入 / $25.00 输出
$5.00 输入 / $25.00 输出
$5.00 输入 / $25.00 输出
$3.30 输入 / $16.50 输出
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.42).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($30.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($210.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
目前我们把 OpenAI 的 GPT-5.4 排在第一,主要原因是在 Tool calling、结构化输出、推理这三项 Agent 核心能力上综合得分最高,并且输出 token 上限适中。排名根据实时模型元数据自动重算 —— 详细规则见上方「我们的筛选逻辑」。
DeepSeek V4 Flash(DeepSeek)是榜单中价格最低的,输入每百万 token $0.140,输出每百万 token $0.280。其它入选项的价格依次往上递增。
每一项都来自我们 use-case-rules 配置里的一条程序化规则:先用硬过滤条件(例如 Tool calling 必选、上下文 ≥ 100K)筛选,再用一组结合能力、上下文窗口与价格的数值打分。我们从不手工调整排序,但会手工迭代规则。完整数据来源是 models.dev API,每日同步。
底层模型数据每天从 models.dev 同步一次,数据有变化时静态页面会重新构建。下方「最近更新」标注的就是最近一次构建日期。
Coding 与 Agent 类工作流几乎一定要调用外部工具 —— 编辑器、shell、测试运行器、数据库等。如果模型不原生支持 function calling,你只能解析模型自由生成的文本,这在生产环境里非常脆弱。
最近更新:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.