ذكاء نماذج الذكاء الاصطناعي

أفضل نماذج الذكاء الاصطناعي · 2026-06-29

أفضل نماذج اللغة-الرؤية (VLM) 2026

صورة داخلية ونص خارجي لواجهات المستخدم ومخططات OCR وقراءة المخططات وصور المنتجات.

كيف اخترنا هذه

  • إدخال الصورة إلزامي؛ نستبعد النماذج النصية فقط.
  • التسعير العام مطلوب — بدونه يصعب النشر الآمن.
  • النتيجة = السياق − السعر لموازنة النافذة الكبيرة والتكلفة.

أفضل 10 اختيارات

$0.180 إدخال / $0.450 إخراج

  • السياق: 2M
  • المزودون: 7
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية

$0.170 إدخال / $0.660 إخراج

  • السياق: 3.50M
  • المزودون: 1
  • استدعاء الأدوات
  • الرؤية
  • أوزان مفتوحة

$0.170 إدخال / $0.660 إخراج

  • السياق: 3.50M
  • المزودون: 1
  • استدعاء الأدوات
  • الرؤية
  • أوزان مفتوحة

$1.25 إدخال / $2.50 إخراج

  • السياق: 2M
  • المزودون: 6
  • إخراج منظم
  • الاستدلال
  • الرؤية

$1.25 إدخال / $2.50 إخراج

  • السياق: 2M
  • المزودون: 4
  • استدعاء الأدوات
  • إخراج منظم
  • الاستدلال
  • الرؤية

$0.075 إدخال / $0.300 إخراج

  • السياق: 1.05M
  • المزودون: 4
  • استدعاء الأدوات
  • إخراج منظم
  • الرؤية

$0.090 إدخال / $0.360 إخراج

  • السياق: 1.05M
  • المزودون: 6
  • استدعاء الأدوات
  • إخراج منظم
  • الاستدلال
  • الرؤية

$0.080 إدخال / $0.400 إخراج

  • السياق: 1.05M
  • المزودون: 1
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية
  • أوزان مفتوحة

$0.100 إدخال / $0.400 إخراج

  • السياق: 1.05M
  • المزودون: 17
  • استدعاء الأدوات
  • إخراج منظم
  • الاستدلال
  • الرؤية

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

Google
Gemini 2.0 Flash-Lite
$0.075 in / $0.300 out · 1.05M ctx

Lowest total per-1M-token cost in this list ($0.38).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

xAI
X-Ai/Grok-4-Fast-Non-Reasoning
$0.180 in / $0.450 out · 2M ctx

Median price ($0.63) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

xAI
Grok 4.20
$1.25 in / $2.50 out · 2M ctx

Highest-priced pick in the list ($3.75) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

aihubmix
Coding Xiaomi MiMo-V2.5
$0.080 in / $0.400 out · 1.05M ctx

Open weights and the cheapest in that subset ($0.48).

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

ما هو أفضل نموذج ذكاء اصطناعي لـ فهم الصور في عام 2026؟

حاليًا نضع Grok 4 Fast (Reasoning) من xAI في المرتبة الأولى، أساسًا لأن يقبل إدخال الصور وله سعر منشور ويوفر أفضل نسبة سياق / تكلفة في تلك المجموعة. يُعاد حساب الترتيب من البيانات الوصفية الحية للنموذج — راجع 'القاعدة' في القسم 'كيف اخترنا هذه' أعلاه.

ما هو الخيار الأرخص في هذه القائمة؟

Gemini 2.0 Flash-Lite (Google) هو الأرخص بسعر $0.075 لكل مليون رمز إدخال و $0.300 لكل مليون رمز إخراج. تتدرج تكاليف باقي العناصر صعودًا من هناك.

كيف يتم إنشاء هذه التصنيفات؟

كل اختيار يأتي من قاعدة برمجية في إعداداتنا use-case-rules: فلتر صارم (مثل: استدعاء أدوات إلزامي، سياق ≥ 100K) بالإضافة إلى درجة عددية تجمع القدرة ونافذة السياق والسعر. لا نُرتب يدويًا أبدًا، لكننا نُحرر القاعدة. تُحدَّث بيانات النماذج يوميًا من فهرس قانوني موحَّد.

كم مرة يتم تحديث هذه الصفحة؟

تُحدَّث بيانات النموذج الأساسية مرة واحدة يوميًا، وتُعاد إنشاء الصفحة الثابتة عند تغير البيانات. تاريخ 'آخر تحديث' أدناه يوضح آخر إعادة إنشاء.

آخر تحديث:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Pricing and capabilities are refreshed daily and reconciled against each provider's official documentation. Always verify critical production decisions with the provider directly.