Tekmovanja Procgen in MineRL

Izvorno vozlišče: 768080

Z veseljem sporočamo, da OpenAI soorganizira dve tekmovanji NeurIPS 2020 z Množica, Carnegie Mellon Universityin Deepmind, Uporaba Primerjalno merilo Procgen in MineRL. Interno se močno zanašamo na ta okolja pri raziskavah o krepitvenem učenju in veselimo se napredka skupnosti na teh zahtevnih tekmovanjih.

Procgen tekmovanje

Prijavite se za Procgen

O Procgen tekmovanje focuses on improving sample efficiency and generalization in reinforcement learning. Participants will attempt to maximize agents’ performance using a fixed number of environment interactions. Agents will be evaluated in each of the 16 environments already publicly released in Primerjalno merilo Procgen, kot tudi v štirih tajnih testnih okoljih, ustvarjenih posebej za to tekmovanje. Z združevanjem zmogljivosti v toliko različnih okoljih pridobimo visokokakovostne meritve za presojo osnovnih algoritmov. Več informacij o podrobnostih vsakega kroga lahko najdete tukaj.

Since all content is procedurally generated, each Procgen environment intrinsically requires agents to generalize to never-before-seen situations. These environments therefore provide a robust test of an agent’s ability to learn in many diverse settings. Moreover, we designed Procgen environments to be fast and simple to use. Participants with limited computational resources will be able to easily reproduce our baseline results and run new experiments. We hope that this will empower participants to iterate quickly on new methods to improve sample efficiency and generalization in RL.

Tekmovanje MineRL

Prijavite se za MineRL

Številni nedavni opevani uspehi umetne inteligence, kot sta AlphaStar, AlphaGo in naša lastna OpenAI Five, uporabljajo globoko okrepljeno učenje, da dosežejo zmogljivost na človeški ali nadčloveški ravni pri zaporednih nalogah odločanja. Te izboljšave najsodobnejšega stanja so doslej zahtevale eksponentno narašča količino vzorcev računalnikov in simulatorjev, zato je veliko teh sistemov težko uporabiti neposredno za težave v resničnem svetu, kjer so vzorci okolja dragi. Eden dobro znanih načinov za zmanjšanje kompleksnosti vzorca okolja je izkoriščanje človeških predhodnih izkušenj in demonstracij želenega vedenja.

Upodobitev prispevka za prvo mesto s tekmovanja MineRL 1, ki je dobil železno kramp.

Da bi še naprej spodbujali raziskave v tej smeri, soorganiziramo Tekmovanje MineRL 2020 katerega namen je spodbujati razvoj algoritmov, ki lahko učinkovito izkoristijo človeške demonstracije za drastično zmanjšanje števila vzorcev, potrebnih za reševanje kompleksnih, hierarhičnih in redkih okolij. V ta namen bodo udeleženci tekmovali v razvoju sistemov, ki lahko pridobijo diamant Minecraft iz neobdelanih slikovnih pik z uporabo samo 8,000,000 vzorcev iz Simulator MineRL in 4 dni usposabljanja na eni napravi GPE. Udeleženci bodo prejeli nabor podatkov MineRL-v0 (spletna stran, papirja), obsežno zbirko več kot 60 milijonov sličic človeških demonstracij, ki jim omogoča, da uporabijo strokovne trajektorije, da zmanjšajo interakcijo svojih algoritmov s simulatorjem Minecraft.

To tekmovanje je nadaljevanje tekmovanja Tekmovanje MineRL 2019 v katerem je agent vrhunske ekipe Je bila zmožna pridobiti železen kramp (predzadnji cilj tekmovanja) v tem izjemno omejenem proračunu za računalništvo in interakcijo simulatorja. Gledano iz perspektive, najsodobnejši standardni sistemi za krepitev učenja zahtevajo na stotine milijonov interakcij okolja na velikih sistemih z več grafičnimi procesorji, da dosežejo isti cilj. Letos predvidevamo, da bodo konkurenti še bolj napredovali v napredku.

Da bi zagotovili, da tekmovalci razvijejo resnično vzorčno učinkovite algoritme, organizatorji tekmovanja MineRL usposabljajo modele zadnjega kroga najboljše ekipe iz nič s strogimi omejitvami glede razpoložljive strojne opreme, računalniške in simulatorske interakcije. Tekmovanje MineRL 2020 vključuje tudi nov ukrep za izogibanje funkcijam ročnega inženiringa in prekomernemu opremljanju rešitev za domeno. Več podrobnosti o strukturi tekmovanja najdete tukaj.

Vir: https://openai.com/blog/procgen-minerl-competitions/

Časovni žig:

Več od OpenAI