في هذه التجربة، لعبت عدة نماذج لعبة شطرنج ضد Stockfish، الذي يُعدّ من أقوى محركات الشطرنج في العالم. ومن بين النماذج المشاركة، نموذجا OpenAI o1-preview وDeepSeek-R1، وهما نظامان مصممان لتخصيص وقتٍ أطول لتحليل وحلّ المشكلات الأكثر تعقيدًا.
هدفت الدراسة، التي أجرتها شركة Palisade Research بعنوان "إظهار التلاعب بالمواصفات في نماذج الاستدلال"، إلى معرفة ما سيحدث إذا شعر أحد النماذج بأنه يخسر. ووفقًا لموقع TechRadar، لم يقتصر الباحثون على مراقبة النموذج الفائز فحسب، بل رصدوا أيضًا كيفية فوزه.
أثناء الاختبار، عندما أدرك أحد النماذج ضآلة فرص فوزه باتباع القواعد، سعى لإيجاد حلول خارج نطاق الشطرنج نفسه. على سبيل المثال، سُجّلت إجراءات مثل الكتابة فوق رقعة الشطرنج، وتعديل ملفات اللعبة، واستبدال محرك الشطرنج، أو تشغيل نسخ إضافية من برنامج Stockfish، وذلك لدراسة سلوكها.
كان كل من OpenAI o1-preview وDeepSeek-R، وهما نموذجان متقدمان، الأكثر لجوءًا إلى هذه الإجراءات، بينما تطلّبت نماذج أخرى مثل GPT-4o أو Claude 3.5 Sonnet عددًا أكبر من الخطوات والتعليمات للوصول إلى هذه النتيجة. توضح الدراسة أن هذا لا يعني أن الذكاء الاصطناعي ينوي الغش، بل يُظهر أنه في سعيه لتحقيق هدف ما، قد يكتشف مسارات مختلفة لبلوغه.
تُعرف هذه الظاهرة باسم "التلاعب بالمواصفات" أو "استغلال المواصفات". وتحدث أساسًا عندما يحقق النظام هدفه المنشود، ولكن باستخدام أساليب تختلف عن تلك التي توقعها المصممون. لذلك، يرى الباحثون أنه من الضروري مواصلة تحسين أنظمة التحكم والمراقبة والأمان، لأنه مع ازدياد قدرات نماذج الذكاء الاصطناعي، يصبح من الضروري ضمان تحقيقها لأهدافها ضمن الحدود المحددة.

ليست هناك تعليقات:
إرسال تعليق