علم هذا الروبوت المشي في محاكاة - ثم ذهب في نزهة في بيركلي

عقدة المصدر: 807787

مؤخرًا ، في معمل بيركلي ، علم روبوت يدعى كاسي نفسه المشي، قليلا مثل طفل صغير. من خلال التجربة والخطأ ، تعلمت التحرك في عالم محاكاة. ثم أرسله معالجه في جولة في حقل ألغام من اختبارات العالم الحقيقي ليروا كيف سيكون أداؤه.

وكما اتضح ، كان أداؤه جيدًا جدًا. مع عدم وجود مزيد من الضبط الدقيق ، كان الروبوت - الذي هو في الأساس مجرد زوج من الأرجل - قادرًا على المشي في جميع الاتجاهات ، والقرفصاء أثناء المشي ، والضبط نفسه عند دفعه عن التوازن ، والتكيف مع أنواع مختلفة من الأسطح.

إنها المرة الأولى التي يتم فيها تطبيق نهج التعلم الآلي المعروف باسم التعلم المعزز بنجاح في الروبوتات ذات الأرجل.

من المحتمل ألا يكون هذا هو أول فيديو روبوت تشاهده ، ولا الأكثر تلميعًا.

على مدار سنوات ، كان الإنترنت مفتونًا بمقاطع فيديو للروبوتات التي تقوم بأكثر من مجرد المشي واستعادة توازنها. كل ما هو على الطاولة رهانات هذه الأيام. تصدر Boston Dynamics ، بطل الوزن الثقيل في مقاطع فيديو الروبوت ، بانتظام لقطات مذهلة للعقل لروبوتات تمارس رياضة الباركور ، شقلباتو إجراءات الرقص المعقدة. في بعض الأحيان ، يمكن أن يبدو العالم روبوت هو قاب قوسين أو أدنى.

هذا الشعور بالرهبة مستحق. تعد Boston Dynamics واحدة من أفضل الشركات المصنعة للروبوتات المتقدمة في العالم.

لكن لا يزال يتعين عليهم ذلك برنامج يدوي دقيق وتصميم الحركات الروبوتات في مقاطع الفيديو الخاصة بهم. هذا نهج قوي ، وقد قام فريق Boston Dynamics بأشياء لا تصدق به.

ومع ذلك ، في مواقف العالم الحقيقي ، تحتاج الروبوتات إلى أن تكون قوية ومرنة. إنهم بحاجة إلى التعامل بانتظام مع ما هو غير متوقع ، ولن يفعلوا أي قدر من تصميم الرقصات. هذه هي الطريقة التي نأمل أن يساعد بها التعلم الآلي.

تم استغلال التعلم المعزز بشكل أكثر شهرة من قبل Alphabet's DeepMind لتدريب الخوارزميات ضرب البشر في بعض أصعب الألعاب. بشكل مبسط ، تم تصميمه على غرار الطريقة التي نتعلم بها. المس الموقد ، واحترق ، لا تلمس الشيء اللعين مرة أخرى ؛ قل من فضلك ، احصل على حبة جيلي ، اسأل بأدب عن حبة أخرى.

في حالة كاسي ، استخدم فريق بيركلي التعلم المعزز لتدريب خوارزمية على السير في محاكاة. إنه ليس أول ذكاء اصطناعي يتعلم المشي بهذه الطريقة. لكن الانتقال من المحاكاة إلى العالم الحقيقي لا يترجم دائمًا.

يمكن للاختلافات الدقيقة بين الاثنين (حرفيًا) أن تتعثر روبوتًا ناشئًا أثناء تجربته لمهارات sim الخاصة به لأول مرة.

للتغلب على هذا التحدي ، استخدم الباحثون عمليتي محاكاة بدلاً من واحدة. المحاكاة الأولى ، بيئة تدريب مفتوحة المصدر تسمى MuJoCo ، كانت حيث تعتمد الخوارزمية على مكتبة كبيرة من الحركات المحتملة ، ومن خلال التجربة والخطأ ، تعلمت تطبيقها. المحاكاة الثانية ، المسماة Matlab SimMechanics ، كانت بمثابة أرض اختبار منخفضة المخاطر تتطابق بشكل أكثر دقة مع ظروف العالم الحقيقي.

بمجرد أن أصبحت الخوارزمية جيدة بما فيه الكفاية ، انتقلت إلى كاسي.

والمثير للدهشة أنه لا يحتاج إلى مزيد من التلميع. قال بطريقة أخرى ، عندما ولدت في العالم المادي - عرفت كيف تسير على ما يرام. بالإضافة إلى ذلك ، كانت قوية جدًا أيضًا. كتب الباحثون أن محركين في ركبة كاسي تعطلا أثناء التجربة ، لكن الروبوت كان قادرًا على التكيف والاستمرار في النقل بالشاحنات.

عملت المعامل الأخرى بجد في تطبيق التعلم الآلي على الروبوتات.

استخدمت جوجل العام الماضي التعلم المعزز لتدريب روبوت رباعي الأرجل (أبسط). و لقد استخدمته شركة أوبن إيه آي بأذرع آلية. من المرجح أن تستكشف Boston Dynamics أيضًا طرقًا لذلك زيادة الروبوتات الخاصة بهم من خلال التعلم الآلي. نهج جديدة - مثل هذا تهدف إلى تدريب الروبوتات متعددة المهارات أو هذا تقديم التعلم المستمر بعد التدريب - قد يحرك الاتصال الهاتفي أيضًا. ومع ذلك ، لا يزال الوقت مبكرًا ، ولا يوجد ما يدل على متى سيتجاوز التعلم الآلي الأساليب التقليدية.

وفي غضون ذلك ، فإن روبوتات Boston Dynamics هي كذلك اختبار المياه التجارية.

ومع ذلك ، يعتقد باحثو الروبوتات ، الذين لم يكونوا جزءًا من فريق بيركلي ، أن النهج واعد. إدوارد جونز ، رئيس مختبر تعلم الروبوت في إمبريال كوليدج لندن ، قال معهد ماساتشوستس للتكنولوجيا تكنولوجي ريفيو، "هذا أحد أكثر الأمثلة نجاحًا التي رأيتها."

يأمل فريق بيركلي في البناء على هذا النجاح من خلال تجربة "سلوكيات أكثر ديناميكية ورشيقة". لذا ، هل من الممكن أن تسير الباركور كاسي في طريقنا؟ سوف نرى.

الصورة الائتمان: الروبوتات الهجينة بجامعة كاليفورنيا بيركلي عبر موقع YouTube

المصدر: https://singularityhub.com/2021/04/11/this-robot-taught-itself-to-walk-in-a-simulation-then-went-for-a-stroll-in-berkeley/

الطابع الزمني:

اكثر من التفرد المحور