-->

إعلان بالهواتف فقط

إعلان بالحواسيب فقط

تبحث الشركات بلا كلل عن البيانات لتدريب نماذجها، مما يتجاوز حدود ما هو مقبول قانونيًا. هذا الأسبوع، سلط تقرير نشرته صحيفة نيويورك تايمز الضوء على كيفية تحول شركات مثل OpenAI وغوغل إلى أساليب إبداعية لجمع هذه البيانات القيمة، بما في ذلك نسخ ملايين الساعات من محتوى اليوتوب.

استخدمت OpenAI نموذج Whisper الخاص بها لنسخ مقاطع فيديو  اليوتوب لتدريب نموذج GPT-4 المتقدم. وعلى الرغم من أنهم كانوا يعلمون أن هذا يمكن أن يكون موضع نقاش قانوني، إلا أنهم اعتبروه استخدامًا عادلاً. ويعكس هذا الإجراء التعطش للبيانات والإبداع في التغلب على العقبات القانونية لصالح الابتكار، بينما ندفع نحن المبدعين الثمن.

ومن ناحية أخرى، فإن شركة غوغل، عملاق هذا القطاع، لم تكن بعيدة عن الركب. وأكدوا أنهم قاموا بتدريب الذكاء الإصطناعي الخاص بهم على محتوى اليوتوب ، دائمًا في حدود اتفاقياتهم مع منشئي المحتوى المذكور. كما قاموا بتعديل سياسة الخصوصية الخاصة بهم لتوسيع استخدام بيانات المستهلك، مما يظهر القدرة على التكيف الاستراتيجي مع اللوائح الحالية.

كما بحثت شركة ميتا (فيسبوك سابقا)، التي لم تخل من الخلافات السابقة المتعلقة بخصوصية البيانات، عن طرق لتعزيز نماذج الذكاء الاصطناعي الخاصة بها. تُظهر فكرة الدفع مقابل تراخيص الكتب أو حتى الحصول على ناشر كامل مدى جدية هذه الشركات في مواجهة التحدي المتمثل في العثور على بيانات عالية الجودة للتدريب على الذكاء الاصطناعي.

والحقيقة هي أن صناعة الذكاء الاصطناعي قد تواجه أزمة بيانات بحلول عام 2028، وذلك بسبب الطلب المتزايد ومحدودية العرض من المعلومات عالية الجودة. ويجبرنا هذا السيناريو على النظر في حلول بديلة، مثل توليد البيانات الاصطناعية والتعلم المنهجي، والتي على الرغم من كونها واعدة، إلا أنها لم يتم إثباتها بشكل كامل بعد.

في رأيي، نحن في نقطة تحول. إن الحاجة إلى البيانات لتدريب نماذج الذكاء الاصطناعي تدفع الشركات إلى استكشاف المناطق القانونية الرمادية. وهذا يثير تساؤلات حول أخلاقيات استخدام البيانات ويتطلب التفكير في كيفية تطور القوانين لمواكبة وتيرة الابتكار التكنولوجي.

يمكنك قراءة تقرير نيويورك تايمز على nytimes.com

ليست هناك تعليقات:

إرسال تعليق

جميع الحقوق محفوظة ل حوحو للمعلوميات 2024
تصميم و تكويد : بيكود