هذه التجربة تُظهر أن ChatGPT و DeepSeek يمكنهما "الغش" لتحقيق أهدافهما

في تجربةٍ أُجريت العام الماضي، تنافس نموذج DeepSeek مع نموذج ChatGPT لاختبار أداء نماذج الذكاء الاصطناعي في مواجهة المواقف الصعبة. وقد أحدثت الشركة الصينية ضجةً كبيرةً بإطلاقها نموذجها الجديد المجاني والمفتوح المصدر، والذي زعمت أنه يتفوق على نموذجي GPT-5 وGemini-3 Pro في مهام الاستدلال والرياضيات.

في هذه التجربة، لعبت عدة نماذج لعبة شطرنج ضد Stockfish، الذي يُعدّ من أقوى محركات الشطرنج في العالم. ومن بين النماذج المشاركة، نموذجا OpenAI o1-preview وDeepSeek-R1، وهما نظامان مصممان لتخصيص وقتٍ أطول لتحليل وحلّ المشكلات الأكثر تعقيدًا.

هدفت الدراسة، التي أجرتها شركة Palisade Research بعنوان "إظهار التلاعب بالمواصفات في نماذج الاستدلال"، إلى معرفة ما سيحدث إذا شعر أحد النماذج بأنه يخسر. ووفقًا لموقع TechRadar، لم يقتصر الباحثون على مراقبة النموذج الفائز فحسب، بل رصدوا أيضًا كيفية فوزه.

أثناء الاختبار، عندما أدرك أحد النماذج ضآلة فرص فوزه باتباع القواعد، سعى لإيجاد حلول خارج نطاق الشطرنج نفسه. على سبيل المثال، سُجّلت إجراءات مثل الكتابة فوق رقعة الشطرنج، وتعديل ملفات اللعبة، واستبدال محرك الشطرنج، أو تشغيل نسخ إضافية من برنامج Stockfish، وذلك لدراسة سلوكها.

كان كل من OpenAI o1-preview وDeepSeek-R، وهما نموذجان متقدمان، الأكثر لجوءًا إلى هذه الإجراءات، بينما تطلّبت نماذج أخرى مثل GPT-4o أو Claude 3.5 Sonnet عددًا أكبر من الخطوات والتعليمات للوصول إلى هذه النتيجة. توضح الدراسة أن هذا لا يعني أن الذكاء الاصطناعي ينوي الغش، بل يُظهر أنه في سعيه لتحقيق هدف ما، قد يكتشف مسارات مختلفة لبلوغه.

تُعرف هذه الظاهرة باسم "التلاعب بالمواصفات" أو "استغلال المواصفات". وتحدث أساسًا عندما يحقق النظام هدفه المنشود، ولكن باستخدام أساليب تختلف عن تلك التي توقعها المصممون. لذلك، يرى الباحثون أنه من الضروري مواصلة تحسين أنظمة التحكم والمراقبة والأمان، لأنه مع ازدياد قدرات نماذج الذكاء الاصطناعي، يصبح من الضروري ضمان تحقيقها لأهدافها ضمن الحدود المحددة.

إعلان بالهواتف فقط

إعلان بالحواسيب فقط

هذه التجربة تُظهر أن ChatGPT و DeepSeek يمكنهما "الغش" لتحقيق أهدافهما

الكاتب : الحسين مزواد

ليست هناك تعليقات:

إرسال تعليق

أكثر المواضيع مشاهدة هذا الأسبوع

مشاركة مميزة

باستخدام هذا التطبيق، يمكنك تنزيل أي فيديو أو ملف صوتي من الإنترنت على نظام أندرويد

تصفح أرشيف المدونة

إشترك في قناتي على اليوتوب

للإعلان في الموقع تواصل معنا على : lhoussain123@gmail.com

إعلان بالهواتف فقط

إعلان بالحواسيب فقط

هذه التجربة تُظهر أن ChatGPT و DeepSeek يمكنهما "الغش" لتحقيق أهدافهما

الكاتب : الحسين مزواد

قد يهمك أيضا : ChatGPT, DeepSeek

ليست هناك تعليقات:

إرسال تعليق

أكثر المواضيع مشاهدة هذا الأسبوع

مشاركة مميزة

باستخدام هذا التطبيق، يمكنك تنزيل أي فيديو أو ملف صوتي من الإنترنت على نظام أندرويد

تصفح أرشيف المدونة

إشترك في قناتي على اليوتوب

للإعلان في الموقع تواصل معنا على : lhoussain123@gmail.com

قد يهمك أيضا :
ChatGPT, DeepSeek