MIT، Autodesk AI تیار کرتا ہے جو لیگو کی مبہم ہدایات کا پتہ لگا سکتا ہے۔

ماخذ نوڈ: 1595808

لیگو سیٹ سے اسٹمپڈ؟ ایک نیا مشین لرننگ فریم ورک آپ کے لیے ان ہدایات کی ترجمانی کر سکتا ہے۔ 

سٹینفورڈ یونیورسٹی کے محققین، ایم آئی ٹی کی کمپیوٹر سائنس اور مصنوعی ذہانت لیب، اور آٹوڈیسک اے آئی لیب نے ایک نیا سیکھنے پر مبنی فریم ورک تیار کرنے کے لیے تعاون کیا ہے جو 2D اشیاء کی تعمیر کے لیے 3D ہدایات کی تشریح کر سکتا ہے۔ 

مینوئل ٹو ایگزیکیوٹیبل پلان نیٹ ورک، یا ایم ای پی نیٹ، کا تجربہ کمپیوٹر سے تیار کردہ لیگو سیٹس، اصلی لیگو سیٹ ہدایات اور مائن کرافٹ طرز کے ووکسیل بلڈنگ پلانز پر کیا گیا، اور محققین نے کہا کہ اس نے بورڈ میں موجودہ طریقوں سے بہتر کارکردگی کا مظاہرہ کیا۔ 

MEPNet کا نیا خیال

مصنوعی ذہانت کے لیے 2D ہدایات کی تشریح کرنا آسان نہیں ہے۔ محققین نے کہا کہ بصری ہدایات سے کچھ اہم مسائل پیدا ہوتے ہیں جو کہ لیگو سیٹ کی طرح مکمل طور پر تصاویر پر مشتمل ہوتے ہیں: 2D اور 3D اشیاء کے درمیان خط و کتابت کی نشاندہی کرنا، اور Lego جیسے بہت سے بنیادی ٹکڑوں سے نمٹنا۔ 

محققین نے کہا کہ بنیادی لیگو اینٹوں کو ماڈل کے مرکزی حصے میں شامل کرنے سے پہلے اکثر پیچیدہ شکلوں میں جمع کیا جاتا ہے۔ محققین نے کہا کہ یہ "مشینوں کے لیے لیگو مینوئل کی تشریح کرنے میں دشواری کو بڑھاتا ہے: اس کے لیے 3D پوز کا اندازہ لگانے کی ضرورت ہوتی ہے جو دیکھے ہوئے قدیم چیزوں پر مشتمل ہوتی ہیں۔"

دستی مراحل کو مشین سے قابل عمل منصوبوں میں پارس کرنے کے موجودہ طریقے بنیادی طور پر دو شکلوں پر مشتمل ہیں، محققین نے کہا: تلاش پر مبنی طریقے جو سادہ اور درست ہیں لیکن حسابی طور پر مہنگے ہیں۔ اور سیکھنے پر مبنی ماڈلز جو تیز ہیں لیکن ان دیکھی 3D شکلوں کو سنبھالنے میں بہت اچھے نہیں ہیں۔

MEPNet، محققین نے کہا، دونوں کو جوڑتا ہے۔

اجزاء کے 3D ماڈل سے شروع کرتے ہوئے، لیگو سیٹ کی موجودہ حالت، اور 2D دستی تصاویر، MEPNet "ہر جزو کے لیے 2D کلیدی نکات اور ماسک کے سیٹ کی پیش گوئی کرتا ہے،" محققین نے لکھا۔

ایک بار یہ ہو جانے کے بعد، 2D کلیدی پوائنٹس "بیس شیپ اور نئے اجزاء کے درمیان ممکنہ کنکشن تلاش کر کے 3D پر دوبارہ پیش کیے جاتے ہیں۔" ٹیم نے لکھا کہ یہ مجموعہ "سیکھنے پر مبنی ماڈلز کی کارکردگی کو برقرار رکھتا ہے، اور 3D اجزاء کو نہ دیکھے جانے کے لیے بہتر بناتا ہے،" ٹیم نے لکھا۔

لیکن کیا یہ میرا Ikea ڈریسر بنا سکتا ہے؟

مقالے میں، محققین نے کہا کہ ان کا مقصد ایسی مشینیں بنانا ہے جو لوگوں کو پیچیدہ اشیاء کو جمع کرنے میں مدد فراہم کریں، اور وہ اپنی ایپلی کیشنز کی فہرست میں لیگو اینٹوں اور ووکسیل ورلڈ کے ساتھ فرنیچر بھی شامل کرتے ہیں۔

ہم نے MEPNet کے پیچھے محققین سے ان کے نئے فریم ورک کے مزید ممکنہ استعمال کے بارے میں پوچھا ہے، لیکن ابھی تک کچھ نہیں سنا ہے۔ اس دوران، یہ فرض کرنا مناسب ہو سکتا ہے کہ MEPNet ایک بک شیلف بنا سکتا ہے – کم از کم عملی طور پر – اجزاء اور ہدایات کی ضروری لائبریری کو دیکھتے ہوئے۔

ایک انسان کو صرف MEPNet کی 3D رینڈرنگ کی تشریح کرنا ہوگی، جو امید ہے کہ فلیٹ پیک فرنیچر کی ہدایات سے زیادہ آسان ہوگی۔

وہ لوگ جو MEPNet کی جانچ کرنا چاہتے ہیں، اور Pytorch سے واقف ہیں، تلاش کر سکتے ہیں۔ Github پر اس کا کوڈ. ۔

ٹائم اسٹیمپ:

سے زیادہ رجسٹر