2025-10-12 - الأحد

دراسة أوبن إيه آي تكشف عن أفضل نموذج ذكاء اصطناعي للاستخدام اليومي

{title}

دراسة أوبن إيه آي تكشف عن أفضل نموذج ذكاء اصطناعي للاستخدام اليومي

أصدرت شركة "أوبن إيه آي" معيارًا جديدًا لتقييم أداء نماذج الذكاء الاصطناعي في المهام اليومية المتعلقة بالأعمال، وفقًا لتقرير نشره موقع "تيك رادار" التقني.

يعتمد معيار "جي دي بي فال" (GDPVal) على قياس أداء نماذج الذكاء الاصطناعي المختلفة من خلال مقارنة أدائها مع أداء البشر في 44 مهنة متنوعة.

توصلت الدراسة التي أجرتها "أوبن إيه آي" باستخدام هذا المعيار إلى أن نموذج "كلود أوبس 4.1" (Claude Opus 4.1) من شركة "آنثروبيك" هو الأفضل في تنفيذ هذه المهام، متفوقًا على نماذج مثل "شات جي بي تي 5" و"جيميناي" و"غروك".

أظهرت النتائج أن "كلود أوبس 4.1" تفوق على الخبراء البشر في 47.6% من الحالات، بينما حقق "شات جي بي تي 5" نسبة 38.8% و"غروك 4" حقق 24.3% و"جيميناي 2.5 برو" حقق 25.5%.

كما أن "كلود" كان الأفضل في 8 من أصل 9 صناعات مختلفة، بما في ذلك القطاعات الحكومية والصحية والمساعدة الاجتماعية. تضمنت المهام التي تم تكليف النموذج بها كتابة رسائل البريد الإلكتروني، والرد على العملاء الغاضبين، وتحسين الجداول، وتدقيق الأسعار.

تأتي هذه الدراسة في إطار جهود "أوبن إيه آي" لإجراء تقييم شامل لنماذج الذكاء الاصطناعي المختلفة، حتى تلك التي تعتبر منافسة لها. وقد طرحت الشركة قبل عدة أسابيع دراسة أخرى تناولت أكثر الاستخدامات شيوعًا في "شات جي بي تي".

تولى فريق الأبحاث الاقتصادية في الشركة مسؤولية هذه الدراسة بالتعاون مع الخبير الاقتصادي ديفيد ديمينج من مكتب البحوث الاقتصادية الوطني.