MIT ve Autodesk, kafa karıştırıcı Lego talimatlarını çözebilen yapay zeka geliştirdi

Kaynak Düğüm: 1595808

Bir Lego seti tarafından şaşkına mı döndünüz? Yeni bir makine öğrenimi çerçevesi, bu talimatları sizin için yorumlayabilir. 

Stanford Üniversitesi, MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı ve Autodesk Yapay Zeka Laboratuvarı'ndaki araştırmacılar, 2B nesneler oluşturmak için 3B talimatları yorumlayabilen yeni bir öğrenme tabanlı çerçeve geliştirmek için işbirliği yaptılar. 

Manuelden Yürütülebilir Plana Ağı veya MEPNet, bilgisayar tarafından oluşturulan Lego setleri, gerçek Lego seti talimatları ve Minecraft tarzı voksel yapım planları üzerinde test edildi ve araştırmacılar, pano genelinde mevcut yöntemlerden daha iyi performans gösterdiğini söyledi. 

MEPNet'in yeni fikri

2B talimatları yorumlamak yapay zeka için kolay değildir. Araştırmacılar, Lego setleri gibi tamamen görüntülerden oluşan görsel talimatlardan kaynaklanan birkaç önemli sorun olduğunu söyledi: 2B ve 3B nesneler arasındaki yazışmaları belirlemek ve Lego gibi birçok temel parçayla uğraşmak. 

Araştırmacılar, temel Lego tuğlalarının, modelin ana gövdesine eklenmeden önce genellikle karmaşık formlarda birleştirildiğini söyledi. Araştırmacılar, "makinelerin Lego kılavuzlarını yorumlamadaki zorluğunu artırıyor: Görülen ilkellerden oluşan görünmeyen nesnelerin 3D pozlarını çıkarmayı gerektiriyor" dedi.

Araştırmacılar, manuel adımları makine tarafından yürütülebilir planlara ayrıştırmanın mevcut yöntemlerinin temel olarak iki biçimden oluştuğunu söyledi: Basit ve doğru ancak hesaplama açısından pahalı olan arama tabanlı yöntemler; ve hızlı olan ancak görünmeyen 3B şekilleri işlemede pek iyi olmayan öğrenmeye dayalı modeller.

Araştırmacılar, MEPNet'in her ikisini de birleştirdiğini söyledi.

Araştırmacılar, bileşenlerin 3B modeli, Lego setinin mevcut durumu ve 2B manuel görüntülerle başlayarak, MEPNet "her bileşen için bir dizi 2B anahtar nokta ve maske öngörüyor" diye yazdı.

Bu yapıldıktan sonra, 2B anahtar noktalar "temel şekil ve yeni bileşenler arasındaki olası bağlantıları bularak 3B'ye geri yansıtılır." Ekip, "öğrenmeye dayalı modellerin verimliliğini korur ve görünmeyen 3D bileşenlere daha iyi genelleştirir" kombinasyonunu yazdı.

Ama benim Ikea şifoniyerimi yapabilir mi?

Makalede, araştırmacılar amaçlarının insanların karmaşık nesneleri bir araya getirmelerine yardımcı olan makineler yaratmak olduğunu ve uygulama listelerine Lego tuğlaları ve voksel dünyalarının yanı sıra mobilyaları da dahil ettiklerini söyledi.

MEPNet'in arkasındaki araştırmacılara yeni çerçevelerinin daha fazla potansiyel kullanımları hakkında sorular sorduk, ancak henüz yanıt alamadık. Bu arada, gerekli bileşen kitaplığı ve yönergeler göz önüne alındığında, MEPNet'in en azından sanal olarak bir kitaplık oluşturabileceğini varsaymak mantıklı olabilir.

Bir insanın yapması gereken tek şey, MEPNet'in düz paket mobilya talimatlarından daha kolay olacağını umduğumuz 3D renderlerini yorumlamak olacaktır.

MEPNet'i test etmek isteyenler ve Pytorch'a aşina olanlar şunları bulabilir: Github'daki kodu🇧🇷 🇧🇷

Zaman Damgası:

Den fazla Kayıt