يُمثل Sora 2 ، وفقًا للشركة نفسها، نقلة نوعية تُضاهي نقلة GPT-3.5 في مجال اللغة. مقارنةً بنموذج Sora الأول، الذي طُرح في فبراير 2024 وركز على اختبار إثبات المفهوم، يُقدم هذا الإصدار الجديد ديناميكيات فيزيائية أكثر اتساقًا وتحكمًا سرديًا أكثر دقة في توليد المشاهد في الفيديو.
من أبرز تطورات Sora 2 قدرته على الالتزام بقوانين الفيزياء بدقة أكبر من النماذج السابقة. فعلى عكس سابقاته، التي غالبًا ما كانت تُشوّه الواقع لتتوافق مع التعليمات النصية، يُظهر Sora 2 بوضوح الخلل والأفعال الخاطئة، مثل ارتداد الكرة الطبيعي بعد رمية فاشلة أو اختلال التوازن أثناء المناورات المعقدة.
أصبح هذا المستوى من المحاكاة ممكنًا بفضل التدريب المكثف على بيانات فيديو واسعة النطاق، وهي عملية لا تزال في بداياتها مقارنةً بنماذج اللغة. يُظهر النموذج سلوكيات متسقة، مثل ثبات الكائن، وثبات حالة العالم، والقدرة على تسلسل الإجراءات عبر مستويات كاميرات متعددة.
بالإضافة إلى ذلك، يُمكن للمستخدمين إضافة عناصر واقعية إلى المشاهد المُولّدة، مثل الأشخاص والحيوانات والأشياء، من خلال التسجيل المُسبق لمظهرهم وصوتهم. تُفعّل هذه الميزة بعد التحقق من الهوية عبر الفيديو والصوت، مما يُعزز آليات الأمان ضد إساءة الاستخدام.
إلى جانب هذا النموذج، أطلقت OpenAI تطبيقًا جديدًا لنظام iOS، يُسمى أيضًا Sora، يتيح للمستخدمين إنشاء مقاطع فيديو مدتها عشر ثوانٍ من رسائل نصية أو صور (بدون وجوه بشرية). تتيح ميزة "cameo " للمستخدمين إضافة صورهم الشخصية أو صور أصدقائهم في مقاطع الفيديو المُنشأة، مع مراعاة الحصول على إذن صريح.
بخلاف المنصات الأخرى، تزعم OpenAI أن منصة Sora ليست مصممة لزيادة وقت الاستخدام، بل لتشجيع الإبداع. يعتمد نظام التوصيات على نماذج لغوية فعّالة تُمكّن من تخصيص المحتوى بلغة طبيعية. تُفضّل الخوارزمية ظهور مقاطع الفيديو التي يُنشئها الأشخاص الذين يتفاعل معهم المستخدم، بدلاً من الترويج للمحتوى المنتشر .
للمراهقين، يتضمن التطبيق قيودًا تلقائية على عدد مقاطع الفيديو التي يُشاهدونها يوميًا، وقيودًا إضافية على استخدام مقاطع الفيديو القصيرة. كما طُوِّرت أدوات الرقابة الأبوية، المتاحة عبر ChatGPT، والتي تتيح للمستخدمين تخصيص صفحتهم، والتحكم في الوصول إلى الرسائل المباشرة، وتعطيل التشغيل المستمر.- الرابط Sora 2


ليست هناك تعليقات:
إرسال تعليق