Procgen és MineRL versenyek

Forrás csomópont: 768080

Örömmel jelentjük be, hogy az OpenAI közösen szervez két NeurIPS 2020 versenyt AIcrowd, Carnegie Mellon Universityés DeepMind, Felhasználva Procgen Benchmark és a MineRL. Belsőleg nagymértékben támaszkodunk ezekre a környezetekre a megerősítő tanulással kapcsolatos kutatások során, és kíváncsian várjuk a közösség által elért előrehaladást ezeken a kihívásokkal teli versenyeken.

Procgen verseny

Regisztráljon a Procgenre

A Procgen verseny focuses on improving sample efficiency and generalization in reinforcement learning. Participants will attempt to maximize agents’ performance using a fixed number of environment interactions. Agents will be evaluated in each of the 16 environments already publicly released in Procgen Benchmark, valamint négy titkos tesztkörnyezetben, amelyeket kifejezetten erre a versenyre hoztak létre. Azáltal, hogy sokféle környezetben összesítjük a teljesítményt, kiváló minőségű mérőszámokat kapunk az alapul szolgáló algoritmusok megítéléséhez. Az egyes fordulók részleteiről bővebb információ található itt.

Since all content is procedurally generated, each Procgen environment intrinsically requires agents to generalize to never-before-seen situations. These environments therefore provide a robust test of an agent’s ability to learn in many diverse settings. Moreover, we designed Procgen environments to be fast and simple to use. Participants with limited computational resources will be able to easily reproduce our baseline results and run new experiments. We hope that this will empower participants to iterate quickly on new methods to improve sample efficiency and generalization in RL.

MineRL verseny

Regisztráljon a MineRL-re

A mesterséges intelligencia közelmúltbeli, ünnepelt sikerei közül sok, mint például az AlphaStar, az AlphaGo és a sajátunk OpenAI Five, használja a mély megerősítő tanulást, hogy emberi vagy emberfeletti szintű teljesítményt érjen el a szekvenciális döntéshozatali feladatokban. A csúcstechnológia ezen fejlesztései eddig egy exponenciálisan növekszik Számítási és szimulátor minták mennyisége, ezért nehéz ezek közül a rendszerek közül sokat közvetlenül alkalmazni olyan valós problémákra, ahol a környezeti minták drágák. A környezeti minta összetettségének csökkentésének egyik jól ismert módja az emberi előzetes és a kívánt viselkedés demonstrálása.

A MineRL 1 verseny 2019. helyezettjének renderelése vascsákány megszerzése.

Az ilyen irányú kutatások további katalizálása érdekében közösen szervezzük a MineRL 2020 verseny amelynek célja olyan algoritmusok fejlesztésének elősegítése, amelyek hatékonyan tudják kihasználni az emberi demonstrációkat, hogy drasztikusan csökkentsék a bonyolult, hierarchikus és ritka környezetek megoldásához szükséges minták számát. Ennek érdekében a résztvevők versenyeznek, hogy olyan rendszereket fejlesszenek ki, amelyek gyémántot szerezhetnek Minecraft nyers pixelekből mindössze 8,000,000 XNUMX XNUMX minta felhasználásával a MineRL szimulátor és 4 nap képzés egyetlen GPU gépen. A résztvevők megkapják a MineRL-v0 adatkészletet ( , papír), több mint 60 millió emberi bemutatóból álló nagyszabású gyűjtemény, amely lehetővé teszi számukra, hogy szakértői pályákat alkalmazzanak az algoritmus és a Minecraft szimulátor közötti kölcsönhatások minimalizálására.

Ez a verseny folytatása a MineRL 2019 verseny amelyben a legjobb csapat ügynöke képes volt szerezzen egy vascsákányt (a verseny utolsó előtti célja) e rendkívül korlátozott számítási és szimulátor-interakciós költségvetés mellett. A korszerű szabványos megerősítő tanulási rendszerek több száz millió környezeti interakciót igényelnek a nagy, több GPU-t tartalmazó rendszereken ugyanazon cél elérése érdekében. Idén arra számítunk, hogy a versenyzők még tovább fejlesztik a legmodernebbet.

Annak garantálása érdekében, hogy a versenyzők valóban hatékony minta-algoritmusokat dolgozzanak ki, a MineRL versenyszervezők a semmiből képezik ki a legjobb csapat utolsó fordulójának modelljeit, szigorú korlátok mellett a rendelkezésre álló hardverre, számításokra és szimulátor-interakciókra vonatkozóan. A MineRL 2020 Competition egy újszerű intézkedést is tartalmaz, amellyel elkerülhető a kézi tervezési funkciók és a megoldások túlillesztése a tartományba. A verseny felépítéséről további részletek találhatók itt.

Forrás: https://openai.com/blog/procgen-minerl-competitions/

Időbélyeg:

Még több OpenAI

GPT-4

Forrás csomópont: 2009180
Időbélyeg: 14. március 2023.