הרובוט הזה לימד את עצמו ללכת בסימולציה - ואז הלך לטיול בברקלי

צומת המקור: 807787

לאחרונה, במעבדת ברקלי, רובוט בשם קאסי לימד את עצמו ללכת, קצת כמו שעושה פעוט. באמצעות ניסוי וטעייה היא למדה לנוע בעולם מדומה. ואז המטפלים שלו שלחו אותו לטייל בשדה מוקשים של בדיקות בעולם האמיתי כדי לראות איך זה יעבור.

וכפי שמתברר, זה עבר די טוב. ללא כוונון עדין נוסף, הרובוט - שהוא בעצם רק זוג רגליים - היה מסוגל ללכת לכל הכיוונים, להתכופף בזמן ההליכה, להתאים לעצמו כשהוא מאוזן ולהסתגל לסוגים שונים של משטחים.

זו הפעם הראשונה שגישה של למידת מכונה המכונה למידת חיזוק מיושמת בצורה כה מוצלחת ברובוטים דו רגליים.

סביר להניח שזה לא סרטון הרובוט הראשון שראית, וגם לא המלוטש ביותר.

במשך שנים, האינטרנט מתלהב מסרטונים של רובוטים שעושים הרבה יותר מאשר ללכת ולהשיב את שיווי המשקל שלהם. כל אלה הם שולחנות השולחן בימינו. בוסטון דינמיקס, האלופה במשקל כבד של סרטוני רובוטים, משחררת באופן קבוע קטעי מדהים של רובוטים שעושים פארקור, גלגלון לאחור, ו שגרות ריקוד מורכבות. לפעמים זה יכול להיראות כמו עולמו של iRobot ממש מעבר לפינה.

תחושת היראה הזו זוכה להצלחה. בוסטון דינמיקס היא אחת מיצרניות המובילות בעולם של רובוטים מתקדמים.

אבל הם עדיין חייבים תכנית ידנית וכוריאוגרפית ידנית של התנועות של הרובוטים בסרטונים שלהם. זו גישה עוצמתית, וצוות בוסטון דינמיקס עשה איתה דברים מדהימים.

במצבים בעולם האמיתי, לעומת זאת, רובוטים צריכים להיות חזקים ועמידים. הם צריכים להתמודד באופן קבוע עם הבלתי צפוי, וכמות כוריאוגרפיה לא תעשה. ככה, מקווים, למידת מכונה יכולה לעזור.

למידת חיזוק נוצלה בצורה המפורסמת ביותר על ידי DeepMind של אלפבית כדי להכשיר אלגוריתמים להכות בני אדם בכמה מהמשחקים הקשים ביותר. באופן פשטני, הוא מעוצב על פי הדרך בה אנו לומדים. לגעת בכיריים, להישרף, לא לגעת שוב בדבר הארור; אמור בבקשה, קבל שעועית ג'לי, בקש בנימוס אחר.

במקרה של קאסי, צוות ברקלי השתמש בלמידת חיזוק כדי לאמן אלגוריתם ללכת בסימולציה. זה לא ה- AI הראשון שלומד ללכת בדרך זו. אבל מעבר מסימולציה לעולם האמיתי לא תמיד מתורגם.

הבדלים עדינים בין השניים יכולים (פשוטו כמשמעו) להכשיל רובוט צעיר כשהוא מנסה לראשונה את כישורי ה- SIM שלו.

כדי להתגבר על אתגר זה, החוקרים השתמשו בשתי הדמיות במקום אחת. הסימולציה הראשונה, סביבת אימונים בקוד פתוח בשם MuJoCo, הייתה המקום בו האלגוריתם התבסס על ספרייה גדולה של תנועות אפשריות ובאמצעות ניסוי וטעייה למד ליישם אותן. הסימולציה השנייה, שנקראה Matlab SimMechanics, שימשה כמגרש לבדיקה נמוכה שתואם ביתר דיוק את התנאים בעולם האמיתי.

ברגע שהאלגוריתם היה מספיק טוב, הוא סיים את קאסי.

ולמרבה הפלא, זה לא היה זקוק להברקה נוספת. אמרה דרך אחרת, כשנולדה לתוך העולם הפיזי - היא ידעה ללכת בסדר גמור. בנוסף, זה היה גם די חזק. החוקרים כותבים כי שני מנועים בברכו של קאסי תקלו במהלך הניסוי, אך הרובוט הצליח להסתגל ולהמשיך במשאיות.

מעבדות אחרות עבדו קשה על יישום למידה מכונה לרובוטיקה.

בשנה שעברה גוגל השתמשה למידת חיזוק להכשרת רובוט (פשוט יותר) בעל ארבע רגליים. ו OpenAI השתמשה בו בידיים רובוטיות. גם בוסטון דינמיקה תבחן דרכים להגדיל את הרובוטים שלהם עם למידת מכונה. גישות חדשות - כמו זה מכוון להכשרת רובוטים רב מיומנים או זה מציע למידה רציפה מעבר לאימון - עשוי גם להזיז את החוגה. עדיין מוקדם ואין לדעת מתי למידת מכונה תעלה על שיטות מסורתיות יותר.

ובינתיים, הרובוטים של בוסטון דינמיקס הם בדיקת המים המסחריים.

ובכל זאת, חוקרי רובוטיקה, שלא היו חלק מצוות ברקלי, חושבים שהגישה מבטיחה. אדוארד ג'ונס, ראש מעבדת למידת הרובוט של אימפריאל קולג 'בלונדון, אמר לי MIT טכנולוגיה סקירה, "זו אחת הדוגמאות המצליחות ביותר שראיתי."

צוות ברקלי מקווה לבנות על ההצלחה על ידי ניסיון "התנהגויות דינמיות וזריזות יותר". אז, האם פארקור-קאסי אוטודידקטי יכול להיות בדרכנו? נראה.

תמונת אשראי: אוניברסיטת קליפורניה ברקלי רובוטיקה היברידית דרך YouTube

מקור: https://singularityhub.com/2021/04/11/this-robot-taught-itself-to-walk-in-a-simulation-then-went-for-a-stroll-in-berkeley/

בול זמן:

עוד מ רכזת הסינגולריות