منذ ذلك الحين، شهد النموذج تحسنًا ملحوظًا من خلال عدة تحديثات طفيفة، ولكنه الآن قفز رسميًا إلى إصدار جديد. أصبح DeepSeek V3.1 واقعًا ملموسًا، وسنعرض لكم ميزاته الجديدة. هل أنتم مستعدون؟
يمكن لـ DeepSeek v3.1 تحليل الكتب التي يصل طولها إلى 400 صفحة، ويعمل كل شيء على نموذج موحد واحد.
في منشور متواضع على WeChat في 19 أغسطس، أعلنت الشركة المطورة لـ DeepSeek أن نموذجها قد وصل رسميًا إلى الإصدار 3.1. وتتمثل الميزة الجديدة الرئيسية في توسيع نافذة السياق، التي تضم الآن 128,000 رمز، بالإضافة إلى زيادة عدد المعلمات إلى 685 مليارًا.
بفضل هذا، سيتمكن DeepSeek V3.1 من معالجة بيانات أكبر بكثير، تعادل كتابًا من 300 إلى 400 صفحة. يُعد هذا مفيدًا بشكل خاص عند تحليل المستندات التقنية وإجراء أبحاث متعمقة، كما يُساعد على الحفاظ على مناقشات مطولة دون فقدان ترابطها. ووفقًا للمطورين، يدعم DeepSeek V3 هذا السياق الموسع داخليًا، ولكنه لم يُفعّل رسميًا إلا الآن لمختلف الأدوات.
علاوةً على ذلك، أزالت DeepSeek جميع الإشارات إلى نموذج R1 من واجهة روبوت المحادثة، مما يُشير إلى أن الانتقال إلى نموذج هجين واحد أصبح واقعًا ملموسًا. ببساطة، في DeepSeek V3.1، لم يعد هناك نموذج استدلال وآخر للمهام غير الاستدلالية؛ بل دُمجت جميع العناصر في نموذج واحد موحد.
صدرت أيضًا أولى اختبارات الأداء، حيث حقق DeepSeek V3.1 نسبة 71.6% في اختبار برمجة Aider. هذا يضعه في مرتبة أعلى من Claude Opus 4، مما يجعله أحد أقوى نماذج البرمجيات مفتوحة المصدر المتاحة حاليًا.
فيما يتعلق بتطبيق واجهة برمجة التطبيقات (API) الخاصة به في أدوات أخرى أو تجميع نسخة خاصة بك للاستخدام دون اتصال بالإنترنت، يمكن لـ DeepSeek V3.1 العمل بتنسيقات دقة متعددة، تمامًا مثل الإصدارات السابقة. يعمل في أوضاع BF16 وFP8 وF32، مما يمنح المستخدمين مرونة أكبر حسب البيئة التي سيتم نشره فيها. يمكن تنزيل الكود المصدري من خلال Hugging Face، وهو مفتوح المصدر ومرخص من معهد ماساتشوستس للتكنولوجيا (MIT).
ليست هناك تعليقات:
إرسال تعليق