MIT, Autodesk razvijata umetno inteligenco, ki lahko ugotovi nejasna navodila Lego

Izvorno vozlišče: 1595808

Vas je zmedel Lego komplet? Novo ogrodje strojnega učenja lahko razlaga ta navodila namesto vas. 

Raziskovalci na Univerzi Stanford, Laboratoriju za računalništvo in umetno inteligenco MIT ter Laboratoriju za umetno inteligenco Autodesk so sodelovali pri razvoju novega okvira, ki temelji na učenju, ki lahko interpretira 2D navodila za gradnjo 3D objektov. 

Omrežje Manual-to-Executable-Plan, oz MEPNet, je bil preizkušen na računalniško ustvarjenih kompletih Lego, pravih navodilih kompleta Lego in gradbenih načrtih vokselov v slogu Minecrafta, raziskovalci pa so dejali, da je na vseh področjih presegel obstoječe metode. 

Nova ideja MEPNeta

Razlaga 2D navodil za umetno inteligenco ni enostavna. Raziskovalci so povedali, da obstaja nekaj ključnih težav, ki izhajajo iz vizualnih navodil, ki so, tako kot kompleti Lego, v celoti sestavljena iz slik: prepoznavanje korespondence med 2D in 3D objekti in obravnavanje številnih osnovnih kosov, kot je Lego. 

Raziskovalci pravijo, da so osnovne kocke Lego pogosto sestavljene v kompleksne oblike, preden se dodajo glavnemu telesu modela. To "povečuje težave za stroje pri interpretaciji priročnikov Lego: zahteva sklepanje o 3D pozah nevidnih predmetov, sestavljenih iz videnih primitivov," so povedali raziskovalci.

Obstoječe metode razčlenjevanja ročnih korakov v strojno izvedljive načrte so v glavnem sestavljene iz dveh oblik, pravijo raziskovalci: metode, ki temeljijo na iskanju, so preproste in natančne, vendar računsko drage; in na učenju temelječi modeli, ki so hitri, vendar niso zelo dobri pri rokovanju z nevidnimi 3D oblikami.

MEPNet, so povedali raziskovalci, združuje oboje.

Začenši s 3D modelom komponent, trenutnim stanjem kompleta Lego in 2D ročnimi slikami, MEPNet "predvidi nabor 2D ključnih točk in mask za vsako komponento," so zapisali raziskovalci.

Ko je to storjeno, se 2D ključne točke "projicirajo nazaj v 3D z iskanjem možnih povezav med osnovno obliko in novimi komponentami." Kombinacija "ohranja učinkovitost modelov, ki temeljijo na učenju, in bolje posplošuje na nevidne 3D komponente," je zapisala ekipa.

Toda ali lahko sestavi mojo komodo Ikea?

Raziskovalci so v prispevku povedali, da je njihov cilj ustvariti stroje, ki ljudem pomagajo pri sestavljanju kompleksnih predmetov, na svoj seznam aplikacij pa vključujejo pohištvo poleg Lego kock in voxel svetov.

Raziskovalce, ki stojijo za MEPNet, smo vprašali o morebitnih uporabah njihovega novega ogrodja, vendar še nismo prejeli odgovora. Medtem bi bilo morda razumno domnevati, da bi MEPNet lahko zgradil knjižno polico – vsaj virtualno – glede na potrebno knjižnico komponent in navodil.

Vse, kar bi človek moral storiti, bi bilo razlagati MEPNet-ove 3D-upodobitve, kar bi bilo, upajmo, lažje kot navodila za plosko pakiranje pohištva.

Tisti, ki želijo preizkusiti MEPNet in poznajo Pytorch, lahko najdejo svojo kodo na Githubu. ®

Časovni žig:

Več od Register