MIT, Autodesk מפתחים בינה מלאכותית שיכולה להבין הוראות לגו מבלבלות

צומת המקור: 1595808

נדהם מסט לגו? מסגרת חדשה של למידת מכונה יכולה לפרש את ההוראות האלה עבורך. 

חוקרים מאוניברסיטת סטנפורד, מעבדת מדעי המחשב והבינה המלאכותית של MIT ומעבדת הבינה המלאכותית של Autodesk שיתפו פעולה כדי לפתח מסגרת חדשה מבוססת למידה שיכולה לפרש הוראות דו-ממדיות לבניית אובייקטים תלת-ממדיים. 

הרשת לתוכנית ידנית להפעלה, או MEPNet, נבדק על סטים של לגו שנוצרו על ידי מחשב, הוראות סט אמיתיות של לגו ותוכניות בנייה של ווקסל בסגנון Minecraft, והחוקרים אמרו שהיא עלתה על השיטות הקיימות בכל הטווח. 

הרעיון החדש של MEPNet

פירוש הוראות דו-ממד אינו קל עבור בינה מלאכותית. החוקרים אמרו שיש כמה בעיות עיקריות הנובעות מהוראות ויזואליות שכמו סטים של לגו, מורכבות לחלוטין מתמונות: זיהוי התכתבות בין אובייקטים דו-ממדיים ותלת-ממדיים, והתמודדות עם הרבה חלקים בסיסיים, כמו לגו. 

לבני לגו בסיסיות, אמרו החוקרים, מורכבות לעתים קרובות לצורות מורכבות לפני שהן מוסיפות לגוף הראשי של המודל. זה "מגביר את הקושי של מכונות לפרש מדריכי לגו: זה מצריך להסיק תנוחות תלת-ממדיות של עצמים בלתי נראים המורכבים מפרימיטיבים נראים", אמרו החוקרים.

השיטות הקיימות של ניתוח שלבים ידניים לתוכניות הניתנות להפעלה באמצעות מכונה מורכבות בעיקר משתי צורות, אמרו החוקרים: שיטות מבוססות חיפוש שהן פשוטות ומדויקות אך יקרות מבחינה חישובית; ומודלים מבוססי למידה שהם מהירים אך אינם טובים במיוחד בטיפול בצורות תלת מימד בלתי נראות.

MEPNet, אמרו החוקרים, משלב את שניהם.

החל ממודל תלת-ממד של הרכיבים, המצב הנוכחי של ערכת הלגו ותמונות ידניות דו-ממדיות, MEPNet "חוזה קבוצה של נקודות מפתח ומסכות דו-ממדיות עבור כל רכיב", כתבו החוקרים.

ברגע שזה נעשה, נקודות המפתח הדו-ממדיות "מוקרנות לאחור לתלת-ממד על ידי מציאת קשרים אפשריים בין צורת הבסיס לרכיבים החדשים." השילוב "שומר על היעילות של מודלים מבוססי למידה, ומכליל טוב יותר לרכיבים תלת מימדיים בלתי נראים", כתב הצוות.

אבל האם זה יכול לבנות את השידה שלי באיקאה?

במאמר אמרו החוקרים שמטרתם היא ליצור מכונות שעוזרות לאנשים להרכיב חפצים מורכבים, והן כוללות רהיטים לצד לבני לגו ועולמות ווקסלים ברשימת היישומים שלהם.

שאלנו את החוקרים מאחורי MEPNet לגבי שימושים פוטנציאליים נוספים של המסגרת החדשה שלהם, אך עדיין לא שמענו. בינתיים, אולי סביר להניח ש-MEPNet תוכל לבנות מדף ספרים - לפחות וירטואלית - בהינתן הספרייה הדרושה של רכיבים והוראות.

כל מה שאדם יצטרך לעשות הוא לפרש את העיבודים התלת-ממדיים של MEPNet, אשר בתקווה יהיה קל יותר מהוראות ריהוט שטוחות.

מי שרוצה לבדוק MEPNet, ומכיר את Pytorch, יכול למצוא הקוד שלו ב-Github. ®

בול זמן:

עוד מ הקופה