Terveisiä Ciceroa, valloittajaa – tekoäly voittaa ihmiset diplomatiassa

Lähdesolmu: 1763695

Meta Platforms Inc, Facebookin emoyhtiö, sanoi luoneensa tekoälyn, joka voi ylittää ihmisten älykkyyden suositun strategiapelin Diplomacy online-versiossa, jossa seitsemän pelaajaa kilpailee Euroopan maantieteellisestä hallinnasta siirtämällä palasia kartalla.

Science.com-sivustolla julkaistussa artikkelissa Meta sanoi Cicero oli ensimmäinen tekoälyagentti, joka saavutti ihmistason suorituskyvyn Diplomacy-pelissä, joka sisältää sekä yhteistyötä että kilpailua ja joka korostaa luonnollisen kielen neuvottelua ja taktista koordinaatiota seitsemän pelaajan välillä.

Yhteensä 40 nimettömässä online-diplomatian pelissä Meta sanoi, että Cicero oli saavuttanut yli kaksinkertaisen keskimääräisen pistemäärän ihmispelaajiin verrattuna ja sijoittui yli 10 prosentin joukkoon osallistujista, jotka pelasivat useampaa kuin yhtä peliä.

Johtava teknologiaryhmä sanoi, että tämä oli osa sen strategista ja pitkän aikavälin tavoitetta tekoälyn alalla rakentaa agentteja, jotka voivat suunnitella, koordinoida ja neuvotella ihmisten kanssa luonnollisella kielellä.

Kuinka tärkeä Cicero on?

Meta sanoo, että Cicero on varsin merkittävä, koska tekoäly luottaa ei-vastustaviin ympäristöihin.

Toisin kuin menneisyydessä, jolloin monen agentin tekoälyn aiemmat suuret menestykset ovat olleet puhtaasti vastustavissa ympäristöissä, kuten shakki (2), Go (3) ja pokeri (4), joissa viestinnällä ei ole arvoa, Cicero käyttää strategista päättelymoottoria. ja ohjattava dialogimoduuli.

Näistä syistä Meta sanoo, että diplomatia on toiminut haastavana vertailukohtana monen tahon oppimiselle.

"Cicero yhdistää ohjattavan dialogimoduulin strategiseen päättelymoottoriin. Pelin jokaisessa vaiheessa Cicero mallintaa, miten muut pelaajat todennäköisesti toimivat pelitilan ja keskustelujen perusteella”, Meta sanoo.

Tekoäly suunnittelee sitten, kuinka pelaajat voivat koordinoida yhteistä hyötyä, ja kartoittaa nämä suunnitelmat luonnollisen kielen viesteiksi.

Terve epäluottamus

Cicero välttää sokeasti luottamista muiden toimijoiden ehdotuksiin ja hylkää suunnitelmat, joilla on alhainen "ennustettu arvo" ja jotka ovat rinnakkain hänen omien etujensa kanssa.

Koska diplomatiassa dialogi tapahtuu yksityisesti pelaajaparien välillä, Cicero perustelee ja analysoi tietoja, joihin pelaajat pääsevät ennusteita tehdessään.

"Esimerkiksi jos Cicero koordinoi hyökkäystä liittolaisen kanssa vihollista vastaan, Ciceron ennustuksessa vastustajan politiikasta on otettava huomioon se tosiasia, että vastustaja ei ole tietoinen aiotusta koordinaatiosta", Meta sanoi.

Meta kertoo osallistuneensa Ciceroon anonyymisti 40 Diplomacy-pelissä ihmispelaajien online-liigassa 19. elokuuta ja 13. lokakuuta 2022 välisenä aikana.

72 tunnin pelin aikana, joka sisälsi 5,277 10 viestin lähettämistä, Cicero sijoittui useampaa kuin yhtä peliä pelanneiden osallistujien XNUMX parhaan joukkoon.

Meta kertoo keränneensä tietoja 125,261 40,408 Diplomacy-pelistä, joita pelattiin verkossa webDiplomacy.net-sivustolla. Näistä peleistä yhteensä 12,901,662 XNUMX peliä sisälsi dialogia, ja pelaajien välillä vaihdettiin yhteensä XNUMX XNUMX XNUMX viestiä.

Kehote: "Robotti voittaa kaikki muut diplomatiapelissä" (tekäälyn luoma).

Meta huomauttaa, että sen uusi tekoäly on kaukana täydellisestä

Cicero lähetti viestejä, jotka sisälsivät virheitä, toisinaan ristiriidassa omien suunnitelmiensa kanssa ja teki strategisia virheitä.

Mutta Meta väittää, että ihmiset kuitenkin päättivät tehdä yhteistyötä tekoälyn kanssa muiden pelaajien sijaan ymmärtämättä, että se oli botti.

”Melkein kaikki aikaisemmat tekoälyn läpimurrot peleissä ovat olleet kahden pelaajan nollasumma-asetuksissa (2p0s), mukaan lukien shakki, Go, heads-up-pokeri ja StarCraft. Rajallisissa 2p0s-peleissä tietyt vahvistusoppimisalgoritmit (RL), jotka oppivat pelaamalla itseään vastaan ​​– tämä prosessi tunnetaan nimellä self-play – lähestyvät politiikkaa, joka on lyömätön tasapainoisissa peleissä”, Meta lisäsi lehdessä. "Toisin sanoen mikä tahansa rajallinen 2p0s-peli voidaan ratkaista itsepelaamalla riittävällä laskenta- ja mallikapasiteetilla."

Meta kuitenkin sanoi yhteistyöpeleistä, että itsepelaamisesta ilman ihmisdataa ei voida enää taata käytäntöä, joka toimii hyvin ihmisten kanssa, vaikka laskenta- ja mallikapasiteetti olisi ääretön, koska itsepelaava agentti voi lähentyä politiikkaan, joka on ei sovi yhteen ihmisten normien ja odotusten kanssa.

Meta lisäsi, että Cicero ennakoi todennäköisiä toimia jokaiselle pelaajalle laudan tilan ja dialogin perusteella ja käyttää sitä lähtökohtana suunnittelualgoritmille käyttäen RL-koulutettuja malleja.

Tekoäly käyttää strategista päättelymoduulia aikomusten ja toimien älykkääseen valitsemiseen, yritys kertoo.

Tämä moduuli suorittaa sitten suunnittelualgoritmin, joka ennustaa kaikkien muiden pelaajien käytännöt pelin tilan ja dialogin perusteella ja ottaa huomioon sekä eri toimien vahvuuden että niiden todennäköisyyden ihmispeleissä. Näiden tietojen ja muuttujien perusteella tehdään Cicerolle paras optimaalinen toimenpide.

Metan perustajan ja toimitusjohtajan Mark Zuckerbergin alaisuudessa yritys on investoinut voimakkaasti tekoälyyn ja metaversumiin hyödyntääkseen nopeasti kasvavaa alaa, joka nähdään teknologian tulevaisuutena.

varten MetaNews.

Aikaleima:

Lisää aiheesta MetaNews