إجراء عاجل من شركة OpenAI بشأن محتوى من منصة يوتيوب
أفادت صحيفة "نيويورك تايمز" الأمريكية بأن شركة OpenAI قامت بتدريب نموذجها الذكاء الاصطناعي GPT-4 على محتوى من منصة يوتيوب.
وأشارت الصحيفة إلى أن OpenAI احتاجت بشدة إلى بيانات التدريب، وقامت بتطوير نموذج النسخ الصوتي Whisper لتحويل الصوت في مقاطع الفيديو على يوتيوب إلى نص، ومن ثم استخدمته في تدريب نموذج GPT-4، الذي يُعد واحدًا من أبرز نماذجها حاليًا.
تلك العملية تثير تساؤلات قانونية، حيث تقع في منطقة غير واضحة في قانون حقوق الطبع والنشر للذكاء الاصطناعي، لكن OpenAI تعتبر أن هذا الاستخدام "عادل".
رئيس OpenAI، جريج بروكمان، شارك في جمع مقاطع الفيديو المستخدمة في التدريب كما ذكرت الصحيفة.
المتحدثة باسم OpenAI، ليندساي هيلد، صرحت لموقع The Verge التقني بأن الشركة تستخدم مصادر متعددة للبيانات، بما في ذلك البيانات العامة والبيانات غير العامة المتاحة للجمهور والشركاء.
في عام 2021، قامت الشركة بتدريب نماذجها على مصادر بيانات مختلفة، بما في ذلك تحويل مقاطع الفيديو والبودكاست والكتب الصوتية على يوتيوب إلى نص، كأحد أفضل مصادر البيانات المتاحة.
وفي ذلك الوقت، قامت الشركة بتدريب نماذجها على بيانات تضمنت الأكواد البرمجية في منصة Github ومحتوى الواجبات المدرسية في منصة Quizlet وغيرها.
زُعم أن هناك أشخاصًا في Google كانوا يعلمون بما تقوم به OpenAI، لكنهم لم يتخذوا إجراءات ضدها؛ لأن Google نفسها كانت تستخدم مقاطع الفيديو على يوتيوب لتدريب نماذجها للذكاء الاصطناعي.
أكدت Google للصحيفة أنها تقوم بذلك فقط مع مقاطع الفيديو التابعة لمنشئي المحتوى الذين وافقوا على ذلك.
في تطور حديث، حذر رئيس شركة YouTube التابعة لـ Google شركة OpenAI من تدريب نموذجها الجديد على تحويل النص إلى فيديو باستخدام مقاطع الفيديو المنشورة على المنصة.
انضموا لقناة متن الإخبارية علي تيليجرام وتابعوا اهم الاخبار في الوقت المناسب.. اضغط هنا https://t.me/matnnews1