وفقًا لمنشور على موقعها الإلكتروني، يُعدّ Claude Opus 4.5 نموذج هندسة البرمجيات الأكثر تطورًا لدى Anthropic. وتزعم الشركة أن Opus 4.5 يتفوق على Gemini 3 Pro وGPT-5.1 Codex-Max وClaude Sonnet 4.5 في اختبارات SWE-bench، التي تقيس القدرة على حل مشاكل Python من مشاريع مفتوحة المصدر على GitHub.
تشير Anthropic إلى أن أداء Claude Opus 4.5 ممتاز في البرمجة المتقدمة ، حيث يستطيع هذا الذكاء الاصطناعي ترحيل الشيفرة البرمجية وإعادة صياغتها ومراجعتها بخطوات أقل وبدقة أعلى. كما أنه قادر على تنفيذ وظائف معقدة، وإنشاء أدوات متكاملة، والعمل مع المستودعات بشكل مستقل تمامًا.
لقياس أدائه في بيئة واقعية، خضعت شركة Claude Opus 4.5 لامتحان مُصمم خصيصًا لمُرشحي الهندسة. في هذا الاختبار المنزلي، كان على المُرشحين للهندسة إيجاد حلول للمشكلات خلال ساعتين. ووفقًا للشركة، تفوقت نتيجة Claude Opus 4.5 على أي مُرشح بشري باستخدام الحوسبة المتوازية، وهي تقنية تُجري محاولات مُتعددة في آنٍ واحد وتُحدد أفضل نتيجة.
بالإضافة إلى تطبيقات هندسة البرمجيات، يُقدم Claude Opus 4.5 أداءً ممتازًا في Excel، محققًا دقةً أكبر بنسبة 20% وكفاءةً أكبر بنسبة 15% في النمذجة المالية. كما يُمكنه تنظيم قواعد البيانات، وإنشاء عروض تقديمية وتقارير بتحليلات مُعمّقة، وصياغة مستندات شاملة، وتخطيط الاستراتيجيات من البداية إلى النهاية دون المساس بالاتساق. وأخيرًا، تُمكّنه قدراته على التعامل مع الوكلاء من أتمتة المهام الطويلة والمتكررة.
سيتوفر Claude Opus 4.5 في تطبيق Claude، وعبر واجهة برمجة التطبيقات (API)، وفي السحابة. مع هذا الإصدار، خفضت Anthropic تكلفة المليون رمز إلى 5 دولارات فقط، وهو سعر قد يُشكّل تحديًا لشركات مثل جوجل وOpenAI.

ليست هناك تعليقات:
إرسال تعليق