AI 模型情报

AI 模型推荐 · 2026-05-12

2026 年最便宜的 LLM API

按每百万 input + output token 的总价从低到高排序。仅收录官方主线模型,且必须公开发布定价。

我们的筛选逻辑

  • 排序键 = (input price + output price) per 1M tokens —— 输入输出对半算总成本。
  • $0 占位价(Github Copilot 重发、免费 tier 镜像)一律排除 —— 'Unknown' 不等于免费。
  • 只收录上下文窗口合法(>0 且 <50M)的文本模型 —— 防止误数据进榜。

Top 10 推荐

1BGE Reranker Basecloudflare-ai-gateway

$0.003 输入 / Unknown 输出

  • 上下文: 128K
  • 服务商: 1

$0.002 输入 / $0.002 输出

  • 上下文: 32K
  • 服务商: 3
  • 工具调用
  • 结构化输出
  • 开放权重
4All-MiniLM-L6-v2digitalocean

$0.009 输入 / Unknown 输出

  • 上下文: 256
  • 服务商: 1
  • 开放权重
8BGE Reranker v2 M3digitalocean

$0.010 输入 / Unknown 输出

  • 上下文: 8K
  • 服务商: 1
  • 开放权重
9BGE M3cloudflare-ai-gateway

$0.012 输入 / Unknown 输出

  • 上下文: 128K
  • 服务商: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 输入 / Unknown 输出

  • 上下文: 128K
  • 服务商: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

2026 年最适合做极致低成本的 AI 模型是哪个?

目前我们把 cloudflare-ai-gateway 的 BGE Reranker Base 排在第一,主要原因是在排除占位 0 价的模型后,它的 input + output 每百万 token 总价是最低的。排名根据实时模型元数据自动重算 —— 详细规则见上方「我们的筛选逻辑」。

这份榜单里最便宜的是哪个?

BGE Reranker Base(cloudflare-ai-gateway)是榜单中价格最低的,输入每百万 token $0.003,输出每百万 token Unknown。其它入选项的价格依次往上递增。

排名是怎么生成的?

每一项都来自我们 use-case-rules 配置里的一条程序化规则:先用硬过滤条件(例如 Tool calling 必选、上下文 ≥ 100K)筛选,再用一组结合能力、上下文窗口与价格的数值打分。我们从不手工调整排序,但会手工迭代规则。完整数据来源是 models.dev API,每日同步。

这个页面多久更新一次?

底层模型数据每天从 models.dev 同步一次,数据有变化时静态页面会重新构建。下方「最近更新」标注的就是最近一次构建日期。

标记为「未公开」价格的模型是否被排除?

是的。我们只对公开发布每百万 token 单价的模型做排序。「未公开」的意思是厂商没有发布公共价目表,并不等于「免费」,把它们当作 $0 显示会产生误导。

最近更新:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.