يقوم باحثو Meta ببناء ذكاء اصطناعي يتعلم بشكل جيد بنفس القدر من المواد المرئية والمكتوبة والمنطوقة

عقدة المصدر: 1590449

تظهر التطورات في مجال الذكاء الاصطناعي باستمرار، ولكنها تميل إلى أن تقتصر على مجال واحد: على سبيل المثال، لا توجد طريقة جديدة رائعة لإنتاج خطاب اصطناعي. أيضا طريقة للتعرف على تعابير الوجوه البشرية. يعمل الباحثون في Meta (AKA Facebook) على شيء أكثر تنوعًا إلى حد ما: الذكاء الاصطناعي الذي يمكنه التعلم بكفاءة من تلقاء نفسه سواء كان يفعل ذلك في المواد المنطوقة أو المكتوبة أو المرئية.

الطريقة التقليدية لتدريب نموذج الذكاء الاصطناعي على تفسير شيء ما بشكل صحيح هي إعطاؤه الكثير والكثير (مثل الملايين) من الأمثلة المصنفة. صورة قطة مع تسمية جزء القطة، ومحادثة مع مكبرات الصوت والكلمات المكتوبة، وما إلى ذلك. لكن هذا النهج لم يعد رائجًا حيث وجد الباحثون أنه لم يعد من الممكن إنشاء قواعد بيانات بالأحجام اللازمة للتدريب التالي يدويًا. -الذكاء الاصطناعي من الجيل. من يريد تسمية 50 مليون صورة قطة؟ حسنًا، ربما هناك عدد قليل من الأشخاص - ولكن من يريد تصنيف 50 مليون صورة للفواكه والخضروات الشائعة؟

حاليًا، بعض أنظمة الذكاء الاصطناعي الواعدة هي ما يسمى بالإشراف الذاتي: وهي نماذج يمكنها العمل من خلال كميات كبيرة من البيانات غير المسماة، مثل الكتب أو مقاطع الفيديو لأشخاص يتفاعلون، وبناء فهم منظم خاص بهم لقواعد النظام. على سبيل المثال، من خلال قراءة ألف كتاب، سيتعلم المواضع النسبية للكلمات والأفكار حول البنية النحوية دون أن يخبره أحد ما هي الأشياء أو المقالات أو الفواصل - لقد حصل على ذلك من خلال استخلاص استنتاجات من الكثير من الأمثلة.

يبدو هذا بديهيًا أقرب إلى الطريقة التي يتعلم بها الناس، وهو جزء من سبب إعجاب الباحثين به. لكن النماذج لا تزال تميل إلى أن تكون أحادية الشكل، وكل العمل الذي تقوم به لإعداد نظام تعليمي شبه خاضع للإشراف للتعرف على الكلام لن ينطبق على الإطلاق على تحليل الصور - فهي ببساطة مختلفة جدًا. هذا هو المكان الذي أحدثت فيه أبحاث Facebook/Meta، المسمى بشكل جذاب data2vec، ادخل.

كانت فكرة data2vec هي بناء إطار عمل للذكاء الاصطناعي من شأنه أن يتعلم بطريقة أكثر تجريدًا، مما يعني أنه بدءًا من الصفر، يمكنك إعطاؤه كتبًا لقراءتها أو صورًا لمسحها ضوئيًا أو التحدث للصوت، وبعد قليل من التدريب تعلم أي من تلك الأشياء. يشبه الأمر إلى حدٍ ما البدء ببذرة واحدة، ولكن اعتمادًا على نوع الغذاء النباتي الذي تقدمه لها، فإنها تنمو لتصبح زهرة نرجس أو زهرة زهرة الثالوث أو زهرة الخزامى.

أظهر اختبار data2vec بعد السماح لها بالتدريب على مجموعة بيانات مختلفة أنها كانت قادرة على المنافسة بل وتفوقت على النماذج المخصصة ذات الحجم المماثل لهذه الطريقة. (وهذا يعني أنه إذا كانت جميع النماذج مقتصرة على 100 ميغابايت، فإن أداء data2vec كان أفضل - وربما تظل النماذج المتخصصة تتفوق عليها مع نموها.)

"الفكرة الأساسية لهذا النهج هي التعلم بشكل أكثر عمومية: يجب أن يكون الذكاء الاصطناعي قادرًا على تعلم القيام بالعديد من المهام المختلفة، بما في ذلك المهام غير المألوفة تمامًا". كتب الفريق في منشور بالمدونة. "نأمل أيضًا أن تقربنا data2vec من عالم تحتاج فيه أجهزة الكمبيوتر إلى القليل جدًا من البيانات المصنفة من أجل إنجاز المهام."

وعلق الرئيس التنفيذي مارك زوكربيرج على البحث قائلاً: "يختبر الناس العالم من خلال مزيج من البصر والصوت والكلمات، ويمكن لأنظمة مثل هذه أن تفهم العالم يومًا ما بالطريقة التي نفهمها".

لا يزال هذا بحثًا في مرحلة مبكرة، لذا لا تتوقع أن يظهر "الذكاء الاصطناعي العام" الأسطوري فجأة - ولكن يبدو أن وجود ذكاء اصطناعي يحتوي على بنية تعليمية عامة تعمل مع مجموعة متنوعة من المجالات وأنواع البيانات هو الأفضل. حل أكثر أناقة من المجموعة المجزأة من الذكاءات الدقيقة التي نتعامل معها اليوم.

رمز data2vec مفتوح المصدر؛ تتوفر هنا وبعض النماذج المدربة مسبقًا.

المصدر: https://techcrunch.com/2022/01/20/meta-researchers-build-an-ai-that-learns-equally-well-from-visual-writer-or-spoken-materials/

الطابع الزمني:

اكثر من تشكرونش