$0.040 입력 / $0.160 출력
- 컨텍스트: 131K
- 제공자: 33
- 도구 호출
- 구조화 출력
- 추론
- 오픈 웨이트
AI 모델 추천 · 2026-05-12
JSON Mode나 스키마 제약 디코딩을 네이티브로 제공하는 순위입니다. 단순 ‘JSON으로 대답해’ 프롬프트가 아니라 실제 파싱 성공률을 중시합니다.
$0.040 입력 / $0.160 출력
$0.950 입력 / $4.00 출력
$0.030 입력 / $0.140 출력
$0.600 입력 / $3.60 출력
$0.300 입력 / $2.50 출력
$0.500 입력 / $3.00 출력
$0.400 입력 / $1.60 출력
$0.150 입력 / $0.600 출력
$0.140 입력 / $0.280 출력
$0.027 입력 / $0.109 출력
Same shortlist sliced four ways — pick the tier that matches your budget and constraints.
Lowest total per-1M-token cost in this list ($0.14).
Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.
Median price ($2.00) — typically the safest default.
Good-enough quality at a mid-tier price. The default choice for most production apps.
Highest-priced pick in the list ($4.95) — usually the flagship.
Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.
No fit in this list
Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.
현재 OpenAI의 GPT OSS 120B을 1 위로 두고 있으며, 주된 이유는 단순한 'JSON 으로 응답' 프롬프팅이 아니라 JSON 스키마 기반 제약 디코딩을 정식으로 지원하기 때문 입니다. 순위는 실시간 모델 메타데이터를 기반으로 자동 재계산됩니다 — 정확한 규칙은 위의 '선정 기준' 를 참고하세요.
Gemma 3 27B (Google) 가 입력 100 만 토큰당 $0.027, 출력 100 만 토큰당 $0.109 으로 가장 저렴합니다. 다른 항목의 가격은 그 위로 올라갑니다.
각 항목은 use-case-rules 설정에 정의된 프로그램적 규칙에서 나옵니다: 하드 필터 (예: 도구 호출 필수, 컨텍스트 ≥ 100K) 와 능력 · 컨텍스트 · 가격을 결합한 수치 점수입니다. 순서를 수동으로 정렬하지는 않지만 규칙 자체는 직접 관리합니다. 데이터 소스는 models.dev API 이며 매일 갱신됩니다.
기본 모델 데이터는 models.dev 에서 하루 한 번 갱신되며, 데이터가 변경되면 정적 페이지가 다시 빌드됩니다. 아래의 '마지막 업데이트' 가 가장 최근 빌드 일자입니다.
마지막 업데이트:
Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.
Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.