Apprendimento di rinforzo con compiti ausiliari non supervisionati

Nodo di origine: 800709

La combinazione di questi compiti ausiliari, insieme al nostro precedente Carta A3C è il nostro nuovo agente UNREAL (UNsupervised REinforcement and Auxiliary Learning). Abbiamo testato questo agente su una suite di 57 giochi Atari e su un ambiente 3D chiamato Labyrinth con 13 livelli. In tutti i giochi, lo stesso agente UNREAL viene addestrato allo stesso modo, sull'immagine grezza prodotta dal gioco, per produrre azioni per massimizzare il punteggio o la ricompensa dell'agente nel gioco. Il comportamento richiesto per ottenere ricompense di gioco è incredibilmente vario, dal raccogliere mele nei labirinti 3D al giocare a Space Invaders: lo stesso algoritmo UNREAL impara a giocare a questi giochi spesso a livello umano e oltre. Alcuni risultati e visualizzazioni possono essere visti nel video qui sotto.

Fonte: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Timestamp:

Di più da Deep Mind - Ultimo post