AI 模型情報

AI 模型推薦 · 2026-05-12

2026 年最便宜的 LLM API

依每百萬 input + output token 的總價由低到高排序。僅收錄官方主線模型,且必須公開發布定價。

我們的篩選邏輯

  • 排序鍵 = (input price + output price) per 1M tokens —— 輸入輸出對半算總成本。
  • $0 佔位價(Github Copilot 重發、免費 tier 鏡像)一律排除 —— 'Unknown' 不等於免費。
  • 只收錄上下文視窗合法(>0 且 <50M)的文字模型 —— 防止誤資料進榜。

Top 10 推薦

1BGE Reranker Basecloudflare-ai-gateway

$0.003 輸入 / Unknown 輸出

  • 上下文: 128K
  • 服務商: 1

$0.002 輸入 / $0.002 輸出

  • 上下文: 32K
  • 服務商: 3
  • 工具呼叫
  • 結構化輸出
  • 開放權重
4All-MiniLM-L6-v2digitalocean

$0.009 輸入 / Unknown 輸出

  • 上下文: 256
  • 服務商: 1
  • 開放權重
8BGE Reranker v2 M3digitalocean

$0.010 輸入 / Unknown 輸出

  • 上下文: 8K
  • 服務商: 1
  • 開放權重
9BGE M3cloudflare-ai-gateway

$0.012 輸入 / Unknown 輸出

  • 上下文: 128K
  • 服務商: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 輸入 / Unknown 輸出

  • 上下文: 128K
  • 服務商: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

2026 年最適合做極致低成本的 AI 模型是哪個?

目前我們把 cloudflare-ai-gateway 的 BGE Reranker Base 排在第一,主要原因是在排除佔位 0 價的模型後,它的 input + output 每百萬 token 總價是最低的。排名根據實時模型 metadata 自動重算 —— 詳細規則見上方「我們的篩選邏輯」。

這份榜單裡最便宜的是哪個?

BGE Reranker Base(cloudflare-ai-gateway)是榜單中價格最低的,輸入每百萬 token $0.003,輸出每百萬 token Unknown。其它入選項的價格依次往上遞增。

排名是怎麼產生的?

每一項都來自我們 use-case-rules 設定中的一條程式化規則:先用硬過濾條件(例如工具呼叫必選、上下文 ≥ 100K)篩選,再用一組結合能力、上下文視窗與價格的數值打分。我們從不手動調整排序,但會手動迭代規則。完整資料來源是 models.dev API,每日同步。

這個頁面多久更新一次?

底層模型資料每天從 models.dev 同步一次,資料有變更時靜態頁面會重新建置。下方「最近更新」標註的就是最近一次建置日期。

標記為「未公開」價格的模型是否被排除?

是的。我們只對公開發布每百萬 token 單價的模型做排序。「未公開」的意思是廠商沒有發布公共價目表,並不等於「免費」,把它們當作 $0 顯示會產生誤導。

最近更新:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.