AI opstartsfigur viser samtalerobot infunderet med OpenAI Tech - Decrypt

AI opstartsfigur viser samtalerobot infunderet med OpenAI Tech – Dekrypter

Kildeknude: 2514384

Robotudvikleren Figure skabte bølger i onsdags, da den delte en videodemonstration af sin første humanoide robot, der var engageret i en samtale i realtid, takket være generativ AI fra OpenAI.

"Med OpenAI kan figur 01 nu have fulde samtaler med mennesker," figur sagde på Twitter og fremhæver dets evne til at forstå og reagere på menneskelige interaktioner øjeblikkeligt.

Virksomheden forklarede, at dens seneste alliance med OpenAI bringer visuel og sproglig intelligens på højt niveau til sine robotter, hvilket giver mulighed for "hurtige, behændige robothandlinger på lavt niveau."

I videoen interagerer figur 01 med sin skabers senior AI-ingeniør Corey Lynch, som sætter robotten igennem adskillige opgaver i et provisorisk køkken, herunder at identificere et æble, fade og kopper.

Figur 01 identificerede æblet som mad, da Lynch bad robotten om at give ham noget at spise. Lynch fik derefter Figur 01 til at samle affald i en kurv og stillede spørgsmål til den samtidigt, hvilket viste robottens multitasking-evner.

På Twitter, Lynch forklarede Figur 01-projektet mere detaljeret.

"Vores robot kan beskrive sin visuelle oplevelse, planlægge fremtidige handlinger, reflektere over sin hukommelse og forklare dens ræsonnement verbalt," skrev han i en omfattende tråd.

Ifølge Lynch feeder de billeder fra robottens kameraer og transskriberer tekst fra tale optaget af indbyggede mikrofoner til en stor multimodal model trænet af OpenAI.

Multimodal AI refererer til kunstig intelligens, der kan forstå og generere forskellige datatyper, såsom tekst og billeder.

Lynch understregede, at figur 01's adfærd blev lært, kørt med normal hastighed og ikke fjernstyret.

"Modellen behandler hele samtalens historie, inklusive tidligere billeder, for at komme med sproglige svar, som bliver talt tilbage til mennesket via tekst-til-tale," sagde Lynch. "Den samme model er ansvarlig for at bestemme, hvilken indlært, lukket sløjfe-adfærd, der skal køre på robotten for at udføre en given kommando, indlæse bestemte neurale netværksvægte på GPU'en og udføre en politik."

Lynch forklarede, at figur 01 er designet til at beskrive dens omgivelser kortfattet og kan anvende "sund fornuft” for beslutninger, som at udlede retter vil blive placeret i et stativ. Den kan også analysere vage udsagn, såsom sult, til handlinger, som at tilbyde et æble, alt imens den forklarer dets handlinger.

Debuten udløste en lidenskabelig reaktion på Twitter, mange mennesker imponerede over mulighederne i Figur 01 - og mere end et par føjede den til listen over milepæle på vej til singulariteten.

Fortæl mig venligst, at dit hold har set alle Terminator-film,” svarede en.

"Vi skal finde John Connor så hurtigt som muligt," tilføjede en anden.

Til AI-udviklere og -forskere leverede Lynch en række tekniske detaljer.

"Al adfærd er drevet af neurale netværk visuomotoriske transformatorpolitikker, der kortlægger pixels direkte til handlinger," sagde Lynch. "Disse netværk tager billeder ombord ved 10 Hz og genererer 24-DOF-handlinger (håndledspositurer og fingerledsvinkler) ved 200 Hz."

Figur 01s virkningsfulde debut kommer, mens politiske beslutningstagere og globale ledere forsøger at kæmpe med udbredelsen af ​​AI-værktøjer til mainstream. Mens det meste af diskussionen har været omkring store sprogmodeller som OpenAIs ChatGPT, Googles Gemini og Anthropics Claude AI, leder udviklere også efter måder at give AI fysiske humanoide robotkroppe.

Figur AI og OpenAI reagerede ikke umiddelbart på Dekryptér s anmode om kommentar.

"Den ene er en slags utilitaristisk målsætning, hvilket er det, Elon Musk og andre stræber efter," fortalte professor Ken Goldberg fra UC Berkeley Industrial Engineering tidligere. Dekryptér. "Meget af det arbejde, der foregår lige nu - hvorfor folk investerer i disse virksomheder som Figure - er, at håbet er, at disse ting kan fungere og være kompatible," sagde han, især inden for rumudforskning.

Sammen med Figure er andre, der arbejder på at fusionere AI med robotteknologi, Hanson Robotics, som i 2016 debuterede sin Desdemona AI robot.

"Selv for et par år siden ville jeg have troet, at det ville være noget, vi skulle vente årtier for at se, at have en fuld samtale med en humanoid robot, mens den planlægger og udfører sin egen fuldt indlærte adfærd," Figur AI's Senior AI Engineer, sagde Corey Lynch på Twitter. "Det er klart, at meget har ændret sig."

Redigeret af Ryan Ozawa.

Hold dig opdateret med kryptonyheder, få daglige opdateringer i din indbakke.

Tidsstempel:

Mere fra Dekryptér