ذكاء نماذج الذكاء الاصطناعي

أفضل نماذج الذكاء الاصطناعي · 2026-05-12

أفضل نماذج اللغة-الرؤية (VLM) 2026

صورة داخلية ونص خارجي لواجهات المستخدم ومخططات OCR وقراءة المخططات وصور المنتجات.

كيف اخترنا هذه

  • إدخال الصورة إلزامي؛ نستبعد النماذج النصية فقط.
  • التسعير العام مطلوب — بدونه يصعب النشر الآمن.
  • النتيجة = السياق − السعر لموازنة النافذة الكبيرة والتكلفة.

أفضل 10 اختيارات

$0.180 إدخال / $0.450 إخراج

  • السياق: 2M
  • المزودون: 9
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية

$0.200 إدخال / $0.500 إخراج

  • السياق: 2M
  • المزودون: 13
  • استدعاء الأدوات
  • الرؤية

$0.200 إدخال / $0.500 إخراج

  • السياق: 2M
  • المزودون: 11
  • استدعاء الأدوات
  • الرؤية

$0.200 إدخال / $0.500 إخراج

  • السياق: 2M
  • المزودون: 8
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية

$0.200 إدخال / $0.500 إخراج

  • السياق: 2M
  • المزودون: 7
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية

$0.170 إدخال / $0.660 إخراج

  • السياق: 3.50M
  • المزودون: 1
  • استدعاء الأدوات
  • الرؤية
  • أوزان مفتوحة

$0.170 إدخال / $0.660 إخراج

  • السياق: 3.50M
  • المزودون: 1
  • استدعاء الأدوات
  • الرؤية
  • أوزان مفتوحة

$2.00 إدخال / $6.00 إخراج

  • السياق: 2M
  • المزودون: 1
  • استدعاء الأدوات
  • الاستدلال
  • الرؤية

$2.00 إدخال / $6.00 إخراج

  • السياق: 2M
  • المزودون: 1
  • استدعاء الأدوات
  • الرؤية

$2.00 إدخال / $6.00 إخراج

  • السياق: 2M
  • المزودون: 1
  • الاستدلال
  • الرؤية

Recommended stack by tier

Same shortlist sliced four ways — pick the tier that matches your budget and constraints.

Budget

xAI
Grok 4 Fast (Reasoning)
$0.180 in / $0.450 out · 2M ctx

Lowest total per-1M-token cost in this list ($0.63).

Lowest-cost option that still meets the use case. Pick this when you have high volume or strict unit-economics.

Balanced

Meta
Llama 4 Scout 17B Instruct
$0.170 in / $0.660 out · 3.50M ctx

Median price ($0.83) — typically the safest default.

Good-enough quality at a mid-tier price. The default choice for most production apps.

Premium

xAI
Grok 4.20 Multi-Agent
$2.00 in / $6.00 out · 2M ctx

Highest-priced pick in the list ($8.00) — usually the flagship.

Highest-capability model in this list. Pick when accuracy or reasoning matters more than cost.

Open-weight

No fit in this list

Open weights — self-host on your own GPUs, fine-tune on private data, run offline. Pricing here reflects the cheapest API host.

Frequently asked questions

ما هو أفضل نموذج ذكاء اصطناعي لـ فهم الصور في عام 2026؟

حاليًا نضع Grok 4 Fast (Reasoning) من xAI في المرتبة الأولى، أساسًا لأن يقبل إدخال الصور وله سعر منشور ويوفر أفضل نسبة سياق / تكلفة في تلك المجموعة. يُعاد حساب الترتيب من البيانات الوصفية الحية للنموذج — راجع 'القاعدة' في القسم 'كيف اخترنا هذه' أعلاه.

ما هو الخيار الأرخص في هذه القائمة؟

Grok 4 Fast (Reasoning) (xAI) هو الأرخص بسعر $0.180 لكل مليون رمز إدخال و $0.450 لكل مليون رمز إخراج. تتدرج تكاليف باقي العناصر صعودًا من هناك.

كيف يتم إنشاء هذه التصنيفات؟

كل اختيار يأتي من قاعدة برمجية محددة في إعداد use-case-rules: مرشح صارم (مثل استدعاء الأدوات مطلوب، السياق ≥ 100K) بالإضافة إلى نتيجة عددية تجمع القدرة ونافذة السياق والسعر. لا نُرتب يدويًا أبدًا، لكننا نُحرر القاعدة. مصدر البيانات الكامل هو واجهة models.dev API، يتم تحديثها يوميًا.

كم مرة يتم تحديث هذه الصفحة؟

تُحدّث بيانات النموذج الأساسية مرة واحدة يوميًا من models.dev، وتُعاد إنشاء الصفحة الثابتة عند تغير البيانات. تاريخ 'آخر تحديث' أدناه يوضح آخر إعادة إنشاء.

آخر تحديث:

Prices in USD per 1M tokens. Unknown means the provider does not publish per-token pricing.

Data is sourced from models.dev and normalized for comparison. Prices and capabilities may change. Always verify critical production decisions with the provider's official documentation.