إذا طلبت من ChatGPT اختيار رقم بين 1 و50، فستجد أن إجابته الأكثر شيوعًا هي 27. قد يبدو الأمر مجرد مصادفة، لكنه شيء يحقق فيه العديد من الخبراء في مجال الذكاء الاصطناعي وعلم الأعصاب الحسابي، لأنه يكشف عن معلومات حول قدرة أدوات الذكاء الاصطناعي هذه على توليد العشوائية.
وفقًا لـ IFL Science، لا يقتصر تكرار هذا الرقم على نظام محدد، إذ غالبًا ما تُقدم روبوتات الدردشة من OpenAI وغوغل ومايكروسوفت وAntropic هذه النتيجة. عند سؤالهم عن سبب اختيارهم له، أجابوا بأنهم يبحثون عن رقم يبدو عشوائيًا، ولكنه ليس نمطيًا كأعداد مضاعفات الخمسة أو العشرة. ترتبط أرقام مثل 17 أو 37 باختيارات بشرية شائعة، ولذلك يتجاهلها الذكاء الاصطناعي.
يوضحون أن نماذج اللغة الطويلة (LLM) لا تفهم الأرقام بحد ذاتها، بل كرموز، مُركزةً على خصائصها بدلًا من معناها الرياضي. أي أنها مُخصصة لمتجه، مما يحد من قدرتها على توليد خيارات عشوائية، ويُفضّل ظهور التكرار.
يقول دانيال كانغ، الأستاذ بجامعة إلينوي في أوربانا-شامبين، إن أحد أسباب التكرار قد يكون التعلم التعزيزي من التغذية الراجعة البشرية (RLHF). فتدريب النماذج بإجابات تعجب المستخدمين يؤدي في النهاية إلى تعزيز إجابة جذابة للآلات، ولكن هذا ليس خطأ الآلات وحدها.
نقول هذا لأن دراسة أجريت على 200 ألف مشارك كشفت أنه عندما طُلب من المشاركين اختيار رقم بين 1 و100، كانت الأرقام الأكثر تكرارًا هي 7 و37 و77. وهذا يعني أن كلًا من البشر والآلات يعتبرون بعض الأرقام أكثر عشوائية من غيرها، على الرغم من أن أندريه كارباتي، وهو شخصية رائدة في مجال الذكاء الاصطناعي، يؤكد أن هذه الظاهرة هي مثال آخر على كيفية تقديم نماذج اللغة إجابات متشابهة للغاية.
تشير نظريات أخرى، مثل نظرية رجل الأعمال تشيستر زيلايا، إلى أن النماذج ستطبق استراتيجيات قريبة من نظرية الألعاب، مثل استخدام شجرة ثنائية لتقسيم نطاق الأرقام، لكن هذا يبدو مستبعدًا. وتوضح هذه النظريات أن نماذج اللغة هذه تعمل باستخدام الاحتمالات المرتبطة بتسلسلات النصوص، وليس من خلال هذا النوع من التفكير، ما لم يُشر إلى ذلك صراحةً.
ليست هناك تعليقات:
إرسال تعليق