AI 모델 인텔리전스

AI 모델 추천 · 2026-05-12

2026 최저가 LLM API

만 토큰당 입력·출력 합비용 오름차순입니다. 공식 메인 라인이면서 단가 공개 모델만 포함합니다.

선정 기준

  • (입력 단가 + 출력 단가)/1M 토큰이 정렬 키입니다.
  • Copilot 재중계 등 $0 플레이스홀더와 Unknown≠무료를 반영합니다.
  • 컨텍스트가 타당한(>0, <50M) 텍스트 모델만 포함합니다.

Top 10 추천

1BGE Reranker Basecloudflare-ai-gateway

$0.003 입력 / Unknown 출력

  • 컨텍스트: 128K
  • 제공자: 1

$0.002 입력 / $0.002 출력

  • 컨텍스트: 32K
  • 제공자: 3
  • 도구 호출
  • 구조화 출력
  • 오픈 웨이트
4All-MiniLM-L6-v2digitalocean

$0.009 입력 / Unknown 출력

  • 컨텍스트: 256
  • 제공자: 1
  • 오픈 웨이트
5Qwen3 Embedding 8BAlibaba (Qwen)

$0.010 입력 / Unknown 출력

  • 컨텍스트: 33K
  • 제공자: 6
6Qwen3 Embedding 4BAlibaba (Qwen)

$0.010 입력 / Unknown 출력

  • 컨텍스트: 33K
  • 제공자: 4
8BGE Reranker v2 M3digitalocean

$0.010 입력 / Unknown 출력

  • 컨텍스트: 8K
  • 제공자: 1
  • 오픈 웨이트
9BGE M3cloudflare-ai-gateway

$0.012 입력 / Unknown 출력

  • 컨텍스트: 128K
  • 제공자: 1
10PLaMo Embedding 1Bcloudflare-ai-gateway

$0.019 입력 / Unknown 출력

  • 컨텍스트: 128K
  • 제공자: 1

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

cloudflare-ai-gateway
BGE Reranker Base
$0.003 in / Unknown out · 128K ctx

Lowest total per-1M-token cost in this list ($0.00).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Alibaba (Qwen)
Qwen3 Embedding 4B
$0.010 in / Unknown out · 33K ctx

Median price ($0.01) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

cloudflare-ai-gateway
PLaMo Embedding 1B
$0.019 in / Unknown out · 128K ctx

Highest-priced pick in the list ($0.02) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

Mistral
Voxtral Small 24B 2507
$0.002 in / $0.002 out · 32K ctx

Open weights and the cheapest in that subset ($0.00).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

2026 년에 최저 비용에 가장 적합한 AI 모델은 무엇인가요?

현재 cloudflare-ai-gateway의 BGE Reranker Base을 1 위로 두고 있으며, 주된 이유는 플레이스홀더 가격을 제외한 모델 중 input + output 100 만 토큰당 합산 비용이 가장 낮기 때문 입니다. 순위는 실시간 모델 메타데이터를 기반으로 자동 재계산됩니다 — 정확한 규칙은 위의 '선정 기준' 를 참고하세요.

이 리스트에서 가장 저렴한 모델은 무엇인가요?

BGE Reranker Base (cloudflare-ai-gateway) 가 입력 100 만 토큰당 $0.003, 출력 100 만 토큰당 Unknown 으로 가장 저렴합니다. 다른 항목의 가격은 그 위로 올라갑니다.

순위는 어떻게 생성되나요?

각 항목은 use-case-rules 설정에 정의된 프로그램적 규칙에서 나옵니다: 하드 필터 (예: 도구 호출 필수, 컨텍스트 ≥ 100K) 와 능력 · 컨텍스트 · 가격을 결합한 수치 점수입니다. 순서를 수동으로 정렬하지는 않지만 규칙 자체는 직접 관리합니다. 데이터 소스는 models.dev API 이며 매일 갱신됩니다.

이 페이지는 얼마나 자주 업데이트되나요?

기본 모델 데이터는 models.dev 에서 하루 한 번 갱신되며, 데이터가 변경되면 정적 페이지가 다시 빌드됩니다. 아래의 '마지막 업데이트' 가 가장 최근 빌드 일자입니다.

'Unknown' 가격 모델은 제외되나요?

예. 100 만 토큰당 가격이 공개된 모델만 순위에 포함합니다. 'Unknown' 은 제공자가 공개 가격표를 게시하지 않았다는 뜻이며 '무료' 와는 다릅니다. $0 으로 표시하면 오해를 부릅니다.

마지막 업데이트:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.