AI opstartsfigur viser samtalerobot infunderet med OpenAI Tech

Genudgivet af Platon

Abonnenter: 0

Robotudvikleren Figure skabte bølger i onsdags, da den delte en videodemonstration af sin første humanoide robot, der var engageret i en samtale i realtid, takket være generativ AI fra OpenAI.

"Med OpenAI kan figur 01 nu have fulde samtaler med mennesker," figur sagde på Twitter og fremhæver dets evne til at forstå og reagere på menneskelige interaktioner øjeblikkeligt.

Virksomheden forklarede, at dens seneste alliance med OpenAI bringer visuel og sproglig intelligens på højt niveau til sine robotter, hvilket giver mulighed for "hurtige, behændige robothandlinger på lavt niveau."

I videoen interagerer figur 01 med sin skabers senior AI-ingeniør Corey Lynch, som sætter robotten igennem adskillige opgaver i et provisorisk køkken, herunder at identificere et æble, fade og kopper.

Figur 01 identificerede æblet som mad, da Lynch bad robotten om at give ham noget at spise. Lynch fik derefter Figur 01 til at samle affald i en kurv og stillede spørgsmål til den samtidigt, hvilket viste robottens multitasking-evner.

På Twitter, Lynch forklarede Figur 01-projektet mere detaljeret.

Vi har nu fulde samtaler med figur 01 takket være vores partnerskab med OpenAI.

Vores robot kan:
– beskrive dens visuelle oplevelse
– planlægge fremtidige tiltag
– reflektere over dens hukommelse
– forklare sin begrundelse mundtligt
Teknisk dyb-dyk 🧵:pic.twitter.com/6QRzfkbxZY

— Corey Lynch (@coreylynch) Marts 13, 2024

"Vores robot kan beskrive sin visuelle oplevelse, planlægge fremtidige handlinger, reflektere over sin hukommelse og forklare dens ræsonnement verbalt," skrev han i en omfattende tråd.

Ifølge Lynch feeder de billeder fra robottens kameraer og transskriberer tekst fra tale optaget af indbyggede mikrofoner til en stor multimodal model trænet af OpenAI.

Multimodal AI refererer til kunstig intelligens, der kan forstå og generere forskellige datatyper, såsom tekst og billeder.

Lynch understregede, at figur 01's adfærd blev lært, kørt med normal hastighed og ikke fjernstyret.

"Modellen behandler hele samtalens historie, inklusive tidligere billeder, for at komme med sproglige svar, som bliver talt tilbage til mennesket via tekst-til-tale," sagde Lynch. "Den samme model er ansvarlig for at bestemme, hvilken indlært, lukket sløjfe-adfærd, der skal køre på robotten for at udføre en given kommando, indlæse bestemte neurale netværksvægte på GPU'en og udføre en politik."

Lynch forklarede, at figur 01 er designet til at beskrive dens omgivelser kortfattet og kan anvende "sund fornuft” for beslutninger, som at udlede retter vil blive placeret i et stativ. Den kan også analysere vage udsagn, såsom sult, til handlinger, som at tilbyde et æble, alt imens den forklarer dets handlinger.

Debuten udløste en lidenskabelig reaktion på Twitter, mange mennesker imponerede over mulighederne i Figur 01 - og mere end et par føjede den til listen over milepæle på vej til singulariteten.

Fortæl mig venligst, at dit hold har set alle Terminator-film,” svarede en.

Fortæl mig venligst, at dit team har set alle terminatorfilm.

— Daniel Innovate (@danielinnov8) Marts 13, 2024

"Vi skal finde John Connor så hurtigt som muligt," tilføjede en anden.

Vi skal finde John Connor så hurtigt som muligt

— Kaylard – e/acc (@KaylardAI) Marts 13, 2024

Sci-fi er blevet til Sci-nonfi

Tillykke til @adcock_brett, @sama, og deres teams for at skabe den første overbevisende demo af life 2.0

— Justin Halford (@Justin_Halford_) Marts 13, 2024

Til AI-udviklere og -forskere leverede Lynch en række tekniske detaljer.

"Al adfærd er drevet af neurale netværk visuomotoriske transformatorpolitikker, der kortlægger pixels direkte til handlinger," sagde Lynch. "Disse netværk tager billeder ombord ved 10 Hz og genererer 24-DOF-handlinger (håndledspositurer og fingerledsvinkler) ved 200 Hz."

Figur 01s virkningsfulde debut kommer, mens politiske beslutningstagere og globale ledere forsøger at kæmpe med udbredelsen af AI-værktøjer til mainstream. Mens det meste af diskussionen har været omkring store sprogmodeller som OpenAIs ChatGPT, Googles Gemini og Anthropics Claude AI, leder udviklere også efter måder at give AI fysiske humanoide robotkroppe.

Figur AI og OpenAI reagerede ikke umiddelbart på Dekryptér s anmode om kommentar.

"Den ene er en slags utilitaristisk målsætning, hvilket er det, Elon Musk og andre stræber efter," fortalte professor Ken Goldberg fra UC Berkeley Industrial Engineering tidligere. Dekryptér. "Meget af det arbejde, der foregår lige nu - hvorfor folk investerer i disse virksomheder som Figure - er, at håbet er, at disse ting kan fungere og være kompatible," sagde han, især inden for rumudforskning.

Sammen med Figure er andre, der arbejder på at fusionere AI med robotteknologi, Hanson Robotics, som i 2016 debuterede sin Desdemona AI robot.

"Selv for et par år siden ville jeg have troet, at det ville være noget, vi skulle vente årtier for at se, at have en fuld samtale med en humanoid robot, mens den planlægger og udfører sin egen fuldt indlærte adfærd," Figur AI's Senior AI Engineer, sagde Corey Lynch på Twitter. "Det er klart, at meget har ændret sig."

Redigeret af Ryan Ozawa.

Hold dig opdateret med kryptonyheder, få daglige opdateringer i din indbakke.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
Kilde: https://decrypt.co/221634/ai-start-up-figure-shows-off-conversational-robot-infused-with-openai-tech

Tidsstempel: Marts 13, 2024

Mere fra Dekryptér

Dapper Labs CEO bekræfter endnu en runde af fyringer

Dekryptér

Kildeknude: 1017873

Tidsstempel: August 8, 2021

Poly Network Hacker returnerer alle stjålne Ethereum-aktiver

Kildeklynge:

Dekryptér

Kildeknude: 1020920

Tidsstempel: August 13, 2021

AI opstartsfigur viser samtalerobot infunderet med OpenAI Tech – Dekrypter

Genudgivet af Platon

Hold dig opdateret med kryptonyheder, få daglige opdateringer i din indbakke.

Mere fra Dekryptér

Dapper Labs CEO bekræfter endnu en runde af fyringer

Mintable genskaber tre NFT'er stjålet fra OpenSea-brugere

Binance US sigter mod at kopiere Coinbase 'Playbook' og blive offentlig: Binance CEO CZ

NFT Software Company Chain Inks fire-årig aftale med New England Patriots

Ethereum Foundation har netop solgt $2.76 millioner i ETH – Dekrypter

Hvad er MASK, og hvad har det at gøre med Elon Musk og Twitter?

Hvorfor en Bitcoin ETF gør BTC-minearbejdere nervøse - Dekrypter

Denne uge på Crypto Twitter: Gensler vil muligvis have Ethereum under SEC-kontrol, Tonga skal gøre Bitcoin lovligt betalingsmiddel

Dogecoin stiger 14%, da Bitcoin kort passerer $ 45,000

Poly Network Hacker returnerer alle stjålne Ethereum-aktiver

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto