-->

إعلان بالهواتف فقط

إعلان بالحواسيب فقط

كشفت شركة علي بابا عن نموذج جديد للذكاء الاصطناعي لمنافسة عمالقة الصناعة. يُعرف هذا النموذج المتعدد الوسائط باسم Qwen-Vlo، وهو قادر على إنشاء الصور وتعديلها من مدخلات النص. يتمتع الذكاء الاصطناعي الجديد بميزة تجعله مختلفًا عن النماذج الأخرى مثل Imagen أو مولد ChatGPT.

كشفت مجموعة علي بابا، بحسب منشور على مدونتها، عن أحدث عضو في عائلة نماذج الذكاء الاصطناعي الخاصة بها. Qwen-Vlo هو نموذج فهم وتوليد متعدد الوسائط موحد يمكنه معالجة النصوص والصور والصوت والفيديو. ومن أهم وظائفه إنشاء الصور وتعديلها.

تزعم شركة علي بابا أن الذكاء الاصطناعي الخاص بها "يفهم" العالم وهو قادر على بناء وسائل ترفيه عالية الجودة. تعرف الشركة الصينية العملاقة Qwen-Vlo على أنها محرك إبداعي للذكاء الاصطناعي يسمح للمستخدمين بإنشاء مشاهد معقدة خطوة بخطوة. وأصبح هذا الأمر ممكناً بفضل تقنية التوليد التدريجي التي تتيح للمستخدمين تصور كيفية إنشاء الصورة في الوقت الفعلي.

على عكس DALL-E و Stable Diffusion التي تستخدم تقنيات توليد ضبابية من الضوضاء العشوائية، يقوم Qwen-VLo ببناء الصورة خطوة بخطوة. يتيح لك التوليد التدريجي تصور العملية كما لو كان الذكاء الاصطناعي يرسم في الوقت الفعلي، من اليسار إلى اليمين ومن الأعلى إلى الأسفل. ويتم تحقيق ذلك من خلال البدء بهيكل أساسي أو صورة ضبابية، تُضاف إليها طبقات من التفاصيل مثل الخطوط العريضة والألوان والملمس والتحسينات.

وتشير الشركة إلى أن هذه التقنية توفر شعوراً أكبر بالشفافية للمستخدم وتمنحه القدرة على تحرير الصورة أثناء إنشائها. يمكن لـ Qwen-VLo أيضًا تعديل الصور الموجودة، وتغيير اللون أو النمط دون التضحية بالبنية. على سبيل المثال، يمكنك رفع صورة وطلب تحويلها إلى نمط Ghibli أو Pixar، كما رأينا قبل بضعة أشهر مع ChatGPT.

تتضمن القدرات الأخرى القدرة على استبدال الخلفية، وإضافة أو إزالة الموضوعات، ونقل الأنماط، أو تعديل الصورة باستخدام تعليمات اللغة الطبيعية. يدعم Qwen-VLo لغات متعددة، لذا يمكنك كتابة المطالبة باللغة العربية أو الإنجليزية أو الصينية. وتفتخر شركة علي بابا بأن نموذجها "يكسر الحواجز اللغوية" وسيحقق دائمًا النتائج المرجوة.

بناءً على الأمثلة، فإن Qwen-VLo أقل من Imagen أو ChatGPT. الصور التي تم إنشاؤها بأسلوب واقعي تكون ناعمة للغاية، على الرغم من أن الإصدارات التي تم إنشاؤها بأسلوب Ghibli أو Pixar تتمتع بجودة أعلى. وبعيدًا عن هذه الاختبارات، يتفوق الذكاء الاصطناعي الخاص بشركة علي بابا في مجالات أخرى، مثل إدراك الأشياء وتحديد موقعها، أو إنشاء تركيبات من مدخلات متعددة.

يعد Qwen-VLo في مرحلة المعاينة، لذا قد ينتج صورًا بها أخطاء. ووعدت شركة علي بابا بأنها سوف تعمل على تعديل النموذج مع مرور الوقت، بالاستعانة بتعليقات المستخدمين والتكنولوجيا الأساسية الخاصة بها والتي تسمح لها بالتحقق من فهمها وتحسين الأداء.

ليست هناك تعليقات:

إرسال تعليق

جميع الحقوق محفوظة ل حوحو للمعلوميات 2025
تصميم و تكويد : بيكود