$2.50 輸入 / $15.00 輸出
- 上下文: 1.05M
- 服務商: 19
- 工具呼叫
- 結構化輸出
- 推理
- 視覺
AI 模型推薦 · 2026-05-12
組合了 Tool calling、結構化輸出與多步推理能力的模型,是搭建生產 Agent 的核心選項。本榜單按這套「Agent 三件套」加權排序。
$2.50 輸入 / $15.00 輸出
$5.00 輸入 / $30.00 輸出
$30.00 輸入 / $180.00 輸出
$1.74 輸入 / $3.48 輸出
$0.140 輸入 / $0.280 輸出
$16.50 輸入 / $82.50 輸出
$5.00 輸入 / $25.00 輸出
$5.00 輸入 / $25.00 輸出
$5.00 輸入 / $25.00 輸出
$3.30 輸入 / $16.50 輸出
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.42).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($30.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($210.00) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
目前我們把 OpenAI 的 GPT-5.4 排在第一,主要原因是在工具呼叫、結構化輸出、推理三項 Agent 核心能力上綜合得分最高,且輸出 token 上限適中。排名根據實時模型 metadata 自動重算 —— 詳細規則見上方「我們的篩選邏輯」。
DeepSeek V4 Flash(DeepSeek)是榜單中價格最低的,輸入每百萬 token $0.140,輸出每百萬 token $0.280。其它入選項的價格依次往上遞增。
每一項都來自我們 use-case-rules 設定中的一條程式化規則:先用硬過濾條件(例如工具呼叫必選、上下文 ≥ 100K)篩選,再用一組結合能力、上下文視窗與價格的數值打分。我們從不手動調整排序,但會手動迭代規則。完整資料來源是 models.dev API,每日同步。
底層模型資料每天從 models.dev 同步一次,資料有變更時靜態頁面會重新建置。下方「最近更新」標註的就是最近一次建置日期。
Coding 與 Agent 類工作流幾乎一定要呼叫外部工具 —— 編輯器、shell、測試執行器、資料庫等。如果模型不原生支援 function calling,你只能解析模型自由生成的文字,這在生產環境裡非常脆弱。
最近更新:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.