এমআইটি, অটোডেস্ক এআই বিকাশ করে যা বিভ্রান্তিকর লেগো নির্দেশাবলী বের করতে পারে

উত্স নোড: 1595808

একটি লেগো সেট দ্বারা স্টাম্পড? একটি নতুন মেশিন লার্নিং ফ্রেমওয়ার্ক আপনার জন্য সেই নির্দেশাবলী ব্যাখ্যা করতে পারে। 

স্ট্যানফোর্ড ইউনিভার্সিটির গবেষকরা, এমআইটির কম্পিউটার সায়েন্স অ্যান্ড আর্টিফিশিয়াল ইন্টেলিজেন্স ল্যাব, এবং অটোডেস্ক এআই ল্যাব একটি অভিনব শিক্ষা-ভিত্তিক কাঠামো তৈরি করতে সহযোগিতা করেছে যা 2D অবজেক্ট তৈরির জন্য 3D নির্দেশাবলী ব্যাখ্যা করতে পারে। 

ম্যানুয়াল-টু-এক্সিকিউটেবল-প্ল্যান নেটওয়ার্ক, বা MEPNet, কম্পিউটার-জেনারেটেড লেগো সেট, আসল লেগো সেট নির্দেশাবলী এবং মাইনক্রাফ্ট-স্টাইল ভক্সেল বিল্ডিং প্ল্যানগুলিতে পরীক্ষা করা হয়েছিল এবং গবেষকরা বলেছেন যে এটি বোর্ড জুড়ে বিদ্যমান পদ্ধতিগুলিকে ছাড়িয়ে গেছে। 

MEPNet এর অভিনব ধারণা

কৃত্রিম বুদ্ধিমত্তার জন্য 2D নির্দেশাবলী ব্যাখ্যা করা সহজ নয়। গবেষকরা বলেছেন যে ভিজ্যুয়াল নির্দেশাবলী থেকে কয়েকটি মূল সমস্যা রয়েছে যা লেগো সেটের মতো, সম্পূর্ণভাবে চিত্রগুলি নিয়ে গঠিত: 2D এবং 3D বস্তুর মধ্যে চিঠিপত্র সনাক্ত করা এবং লেগোর মতো অনেকগুলি মৌলিক অংশ নিয়ে কাজ করা। 

বেসিক লেগো ইট, গবেষকরা বলেছেন, মডেলের মূল অংশে যুক্ত হওয়ার আগে প্রায়শই জটিল আকারে একত্রিত হয়। এটি "লেগো ম্যানুয়ালগুলিকে ব্যাখ্যা করতে মেশিনগুলির জন্য অসুবিধা বাড়ায়: এর জন্য দেখা আদিম বস্তুর সমন্বয়ে অদেখা বস্তুর 3D পোজ অনুমান করা প্রয়োজন," গবেষকরা বলেছেন।

মেশিন-এক্সিকিউটেবল প্ল্যানে ম্যানুয়াল স্টেপ পার্স করার বিদ্যমান পদ্ধতিগুলি প্রধানত দুটি ফর্ম নিয়ে গঠিত, গবেষকরা বলেছেন: অনুসন্ধান-ভিত্তিক পদ্ধতি যা সহজ এবং সঠিক কিন্তু গণনাগতভাবে ব্যয়বহুল; এবং শেখার-ভিত্তিক মডেলগুলি যেগুলি দ্রুত কিন্তু অদেখা 3D আকারগুলি পরিচালনা করতে খুব ভাল নয়৷

MEPNet, গবেষকরা বলেছেন, উভয়কে একত্রিত করে।

উপাদানগুলির একটি 3D মডেল, লেগো সেটের বর্তমান অবস্থা এবং 2D ম্যানুয়াল চিত্র দিয়ে শুরু করে, MEPNet "প্রতিটি উপাদানের জন্য 2D কীপয়েন্ট এবং মুখোশের একটি সেট ভবিষ্যদ্বাণী করে," গবেষকরা লিখেছেন।

একবার এটি হয়ে গেলে, 2D কীপয়েন্টগুলি "বেস আকৃতি এবং নতুন উপাদানগুলির মধ্যে সম্ভাব্য সংযোগ খুঁজে বের করে 3D-এ ফিরে প্রজেক্ট করা হয়।" এই সংমিশ্রণটি "লার্নিং-ভিত্তিক মডেলগুলির দক্ষতা বজায় রাখে এবং অদেখা 3D উপাদানগুলিকে আরও ভালভাবে সাধারণীকরণ করে," দল লিখেছিল৷

কিন্তু এটা কি আমার Ikea ড্রেসার তৈরি করতে পারে?

গবেষণাপত্রে, গবেষকরা বলেছেন যে তাদের লক্ষ্য হল এমন মেশিন তৈরি করা যা মানুষকে জটিল বস্তু একত্র করতে সাহায্য করে এবং তারা তাদের অ্যাপ্লিকেশনের তালিকায় লেগো ইট এবং ভক্সেল ওয়ার্ল্ডের পাশাপাশি আসবাবপত্র অন্তর্ভুক্ত করে।

আমরা MEPNet-এর পিছনে থাকা গবেষকদের তাদের নতুন কাঠামোর আরও সম্ভাব্য ব্যবহার সম্পর্কে জিজ্ঞাসা করেছি, কিন্তু এখনও শুনিনি। ইতিমধ্যে, এটি অনুমান করা যুক্তিসঙ্গত হতে পারে যে MEPNet একটি বুকশেলফ তৈরি করতে পারে - অন্তত কার্যত - উপাদান এবং নির্দেশাবলীর প্রয়োজনীয় লাইব্রেরি দেওয়া।

একজন মানুষকে যা করতে হবে তা হল MEPNet-এর 3D রেন্ডারিং ব্যাখ্যা করা, যা আশাকরি ফ্ল্যাট-প্যাক আসবাবপত্র নির্দেশাবলীর চেয়ে সহজ হবে।

যারা MEPNet পরীক্ষা করতে চান, এবং Pytorch এর সাথে পরিচিত, তারা খুঁজে পেতে পারেন Github এর কোড। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী