شرح التعلم من الصفر

شرح التعلم من الصفر

عقدة المصدر: 1776319

شرح التعلم من الصفر
بروس وارينجتون عبر Unsplash
 

يرجع السبب في أن نماذج التعلم الآلي بشكل عام أصبحت أكثر ذكاءً إلى اعتمادها على استخدام البيانات المصنفة لمساعدتها على التمييز بين كائنين متشابهين. 

ومع ذلك ، بدون مجموعات البيانات المصنفة هذه ، ستواجه عقبات كبيرة عند إنشاء نموذج التعلم الآلي الأكثر فاعلية وجدارة بالثقة. تعتبر مجموعات البيانات المسمى أثناء مرحلة التدريب للنموذج مهمة. 

تم استخدام التعلم العميق على نطاق واسع لحل مهام مثل رؤية الكمبيوتر باستخدام التعلم الخاضع للإشراف. ومع ذلك ، كما هو الحال مع العديد من الأشياء في الحياة ، فإنه يأتي مع قيود. يتطلب التصنيف الخاضع للإشراف كمية وجودة عالية من بيانات التدريب المصنفة من أجل إنتاج نموذج قوي. هذا يعني أن نموذج التصنيف لا يمكنه التعامل مع الفئات غير المرئية. 

ونعلم جميعًا مقدار القوة الحسابية وإعادة التدريب والوقت والمال اللازم لتدريب نموذج التعلم العميق.

ولكن هل يمكن للنموذج أن يظل قادرًا على التمييز بين كائنين دون استخدام بيانات التدريب؟ نعم ، إنه يسمى التعلم بدون طلقة. التعلم بدون طلقة هو قدرة النموذج على أن يكون قادرًا على إكمال مهمة دون تلقي أو استخدام أي أمثلة تدريبية. 

البشر قادرون بشكل طبيعي على التعلم دون الحاجة إلى بذل الكثير من الجهد. تقوم أدمغتنا بالفعل بتخزين القواميس وتسمح لنا بتمييز الأشياء من خلال النظر إلى خصائصها الفيزيائية بسبب قاعدة المعرفة الحالية لدينا. يمكننا استخدام قاعدة المعرفة هذه لمعرفة أوجه التشابه والاختلاف بين الكائنات والعثور على الرابط بينها.

على سبيل المثال ، لنفترض أننا نحاول بناء نموذج تصنيف على أنواع الحيوانات. بالنسبة الى OurWorldInData، تم حساب 2.13 مليون نوع في عام 2021. لذلك ، إذا أردنا إنشاء نموذج التصنيف الأكثر فعالية لأنواع الحيوانات ، فسنحتاج إلى 2.13 مليون فئة مختلفة. هناك حاجة أيضًا إلى وجود الكثير من البيانات. من الصعب الحصول على بيانات عالية الجودة والكمية.

إذن كيف يحل التعلم بدون طلقة هذه المشكلة؟

نظرًا لأن التعلم الخاسر لا يتطلب أن يتعلم النموذج بيانات التدريب وكيفية تصنيف الفصول الدراسية ، فإنه يسمح لنا بالاعتماد بشكل أقل على حاجة النموذج للبيانات المصنفة. 

ما يلي هو ما ستحتاجه بياناتك من أجل المضي قدمًا في التعلم من الصفر.

الفصول التي شوهدت

يتكون هذا من فئات البيانات التي تم استخدامها سابقًا لتدريب نموذج. 

فئات غير مرئية

يتكون هذا من فئات البيانات التي لم يتم استخدامها لتدريب نموذج وسيتم تعميم نموذج التعلم الجديد. 

المعلومات المساعدة

نظرًا لأن البيانات الموجودة في الفصول غير المرئية غير مصنفة ، سيتطلب التعلم بدون طلقة معلومات إضافية من أجل التعلم والعثور على الارتباطات والروابط والخصائص. يمكن أن يكون هذا في شكل تضمين الكلمة ، والأوصاف ، والمعلومات الدلالية.

طرق التعلم الصفرية

عادةً ما يتم استخدام التعلم بدون طلقة في:

  • الأساليب القائمة على المصنف
  • الأساليب القائمة على المثيل

المستويات

يستخدم التعلم بدون طلقة لبناء نماذج للفصول التي لا تتدرب باستخدام البيانات المصنفة ، وبالتالي فهي تتطلب هاتين المرحلتين:

1. تدريب

مرحلة التدريب هي عملية طريقة التعلم التي تحاول الحصول على أكبر قدر ممكن من المعرفة حول جودة البيانات. يمكننا أن ننظر إلى هذا باعتباره مرحلة التعلم. 

2. الاستدلال

خلال مرحلة الاستدلال ، يتم تطبيق جميع المعارف المكتسبة من مرحلة التدريب واستخدامها من أجل تصنيف الأمثلة في مجموعة جديدة من الفصول. يمكننا النظر إلى هذا على أنه مرحلة عمل التنبؤات. 

كيف يعمل؟

سيتم نقل المعرفة من الفئات المرئية إلى الفئات غير المرئية في فضاء متجه عالي الأبعاد ؛ هذا يسمى الفضاء الدلالي. على سبيل المثال ، في تصنيف الصور ، ستخضع المساحة الدلالية مع الصورة لخطوتين:

1. مساحة التضمين المشتركة

هذا هو المكان الذي يتم فيه الإسقاط المتجهات الدلالية وناقلات الميزة المرئية. 

2. أعلى تشابه

هذا هو المكان الذي تتم فيه مطابقة الميزات مع تلك الخاصة بفئة غير مرئية. 

للمساعدة في فهم العملية من خلال المرحلتين (التدريب والاستدلال) ، دعنا نطبقهما في استخدام تصنيف الصور.

قادة الإيمان

شرح التعلم من الصفر
جاري هيتونين عبر Unsplash
 

كإنسان ، إذا قرأت النص الموجود على اليمين في الصورة أعلاه ، فستفترض على الفور أن هناك 4 قطط صغيرة في سلة بنية اللون. لكن دعنا نقول أنه ليس لديك أي فكرة عن ماهية "القطة". ستفترض أن هناك سلة بنية بداخلها 4 أشياء تسمى "القطط". بمجرد العثور على المزيد من الصور التي تحتوي على شيء يشبه "قطة صغيرة" ، ستتمكن من تمييز "قطة صغيرة" عن الحيوانات الأخرى. 

هذا ما يحدث عند استخدامك اللغة التقابلية - التدريب المسبق على الصورة (CLIP) بواسطة OpenAI للتعلم من الصفر في تصنيف الصور. ومن المعروف باسم المعلومات المساعدة. 

قد تفكر ، "حسنًا ، هذه مجرد بيانات مسماة". أنا أفهم لماذا تعتقد ذلك ، لكنهم ليسوا كذلك. المعلومات المساعدة ليست تسميات للبيانات ، فهي شكل من أشكال الإشراف لمساعدة النموذج على التعلم أثناء مرحلة التدريب.

عندما يرى نموذج التعلم بدون طلقة قدرًا كافيًا من أزواج الصور والنصوص ، سيكون قادرًا على تمييز العبارات وفهمها وكيفية ارتباطها بأنماط معينة في الصور. باستخدام تقنية CLIP "التعلم التباين" ، تمكن نموذج التعلم من الصفر من تجميع قاعدة معرفية جيدة ليكون قادرًا على عمل تنبؤات حول مهام التصنيف. 

هذا ملخص لنهج CLIP حيث يقومون بتدريب مشفر صورة ومشفّر نص معًا من أجل التنبؤ بالاقتران الصحيح لمجموعة من أمثلة التدريب (صورة ، نصية). يرجى الاطلاع على الصورة أدناه:

 

شرح التعلم من الصفر
تعلم النماذج المرئية القابلة للتحويل من الإشراف على اللغة الطبيعية

الإستنباط

بمجرد أن يمر النموذج بمرحلة التدريب ، يكون لديه قاعدة معرفية جيدة لإقران الصورة والنص ويمكن الآن استخدامه لعمل تنبؤات. ولكن قبل أن نتمكن من القيام بالتنبؤات بشكل صحيح ، نحتاج إلى إعداد مهمة التصنيف من خلال إنشاء قائمة بجميع التسميات الممكنة التي يمكن للنموذج إخراجها. 

على سبيل المثال ، بالتمسك بمهمة تصنيف الصور على أنواع الحيوانات ، سنحتاج إلى قائمة بجميع أنواع الحيوانات. سيتم ترميز كل واحدة من هذه العلامات ، تي؟ ل T؟ باستخدام برنامج ترميز النص المدروس الذي حدث في مرحلة التدريب. 

بمجرد تشفير الملصقات ، يمكننا إدخال الصور من خلال برنامج تشفير الصور المدربين مسبقًا. سنستخدم تشابه جيب التمام المتري للمسافة لحساب أوجه التشابه بين ترميز الصورة وترميز كل تسمية نصية.

يتم تصنيف الصورة بناءً على الملصق الأكثر تشابهًا مع الصورة. وهذه هي الطريقة التي يتم بها تحقيق التعلم بدون طلقة ، وتحديداً في تصنيف الصور. 

ندرة البيانات

كما ذكرنا سابقًا ، يصعب الحصول على بيانات عالية الجودة والكمية. على عكس البشر الذين يمتلكون بالفعل قدرة التعلم الصفرية ، تتطلب الآلات إدخال بيانات مصنفة للتعلم ومن ثم تكون قادرة على التكيف مع الاختلافات التي قد تحدث بشكل طبيعي. 

إذا نظرنا إلى مثال الأنواع الحيوانية ، كان هناك الكثير. ومع استمرار نمو عدد الفئات في المجالات المختلفة ، سيستغرق الأمر الكثير من العمل لمواكبة جمع البيانات المشروحة.

نتيجة لهذا ، أصبح التعلم بدون طلقة أكثر قيمة بالنسبة لنا. المزيد والمزيد من الباحثين مهتمون بالتعرف التلقائي على السمات للتعويض عن نقص البيانات المتاحة. 

وسم البيانات

فائدة أخرى للتعلم بدون طلقة هي خصائص وسم البيانات. يمكن أن تكون تسمية البيانات كثيفة العمالة ومملة للغاية ، ونتيجة لذلك ، يمكن أن تؤدي إلى أخطاء أثناء العملية. يتطلب تصنيف البيانات خبراء ، مثل المهنيين الطبيين الذين يعملون على مجموعة بيانات طبية حيوية ، وهي مكلفة للغاية وتستغرق وقتًا طويلاً. 

أصبح التعلم بدون طلقة أكثر شيوعًا بسبب القيود المذكورة أعلاه على البيانات. هناك بعض الأوراق التي أوصي بقراءتها إذا كنت مهتمًا بقدراتها:

 
 
نيشا آريا هو عالم بيانات وكاتب تقني مستقل. وهي مهتمة بشكل خاص بتقديم المشورة المهنية في علوم البيانات أو البرامج التعليمية والمعرفة القائمة على النظرية حول علوم البيانات. إنها ترغب أيضًا في استكشاف الطرق المختلفة التي يمكن للذكاء الاصطناعي من خلالها الاستفادة من طول عمر الإنسان. متعلمة حريصة ، تسعى إلى توسيع معرفتها التقنية ومهارات الكتابة لديها ، بينما تساعد في توجيه الآخرين.
 

الطابع الزمني:

اكثر من KD nuggets