وفقًا لتقييم حديث أجرته مجموعة الاختبار المستقلة Artificial Analysis، والذي نشرته صحيفة TechRadar، تشير كل الدلائل إلى أن Gemini 3 Flash قد وصل إلى %9٪ في جزء معدل الهلوسة من معيار AA-Omniscience، مما يعني أن هذا الروبوت الدردشة يقدم إجابات وهمية عندما لا يعرف موضوعًا ما، بدلاً من الرد بـ "لا أعرف".
مع ذلك، من المهم الإشارة إلى أن النسبة المذكورة لا تُقلل من قوة Gemini 3 Flash، إذ لا يزال الأفضل أداءً في الاختبارات العامة. لكن في الواقع، تكمن المشكلة في أنه "يبدو واثقًا أكثر من اللازم، بينما ينبغي أن يكون أكثر تواضعًا".
من جهة أخرى، تجدر الإشارة إلى أن الهلوسة مشكلةٌ منذ ظهور روبوتات المحادثة، نظرًا لافتقارها إلى قيود تحدّ من نتائجها، وعدم وجود حدود واضحة لها في أدوات الفلترة. ومع ذلك، ما يُميّز Gemini هو تكرار هذه الظاهرة في سياقات عدم اليقين، حيث لا توجد إجابة صحيحة واحدة في بيانات التدريب، ولا يوجد مصدر عام موثوق يُمكن الرجوع إليه.
يُعدّ Gemini 3 Flash نموذجًا يُبسّط المهام اليومية بفضل سرعته وكفاءته العالية في تحليل الفيديو واستخراج البيانات، فضلًا عن قدرته على تقديم استجابات بصرية أكثر تعقيدًا. علاوة على ذلك، يتميّز هذا الذكاء الاصطناعي بقدرته على تعديل مهاراته الفكرية، بل والتفكير لفترات أطول في حالات استخدام أكثر تعقيدًا.
باختصار، يتمتع برنامج Gemini 3 Flash بالقدرة على التفكير وحل المهام بسرعة في سير العمل عالي التردد، مع الأخذ في الاعتبار أن المستخدمين يمكنهم استخدامه لرؤية وسماع وفهم أي نوع من المعلومات بسرعة أكبر.
أصبح Gemini 3 Flash متاحًا الآن للمستخدمين كنموذج داخل Gemini الافتراضي، وهو مجاني الاستخدام. ولكن من يمكنه استخدامه؟ أطلقته شركة جوجل للأفراد من خلال تطبيق Gemini وفي وضع الذكاء الاصطناعي في البحث، وللشركات في Vertex AI وGemini Enterprise، وحتى للمطورين من خلال واجهة برمجة تطبيقات Gemini في Google AI Studio، وواجهة سطر أوامر Gemini، ومنصة تطوير وكلاء Google Antigravity الجديدة.
ليست هناك تعليقات:
إرسال تعليق