Aprendizado por reforço com tarefas auxiliares não supervisionadas

Nó Fonte: 800709

A combinação dessas tarefas auxiliares, juntamente com nossas papel A3C é o nosso novo agente UNREAL (UNsupervisioned REinforcement and Auxiliary Learning). Testamos este agente em um conjunto de 57 jogos Atari, bem como em um ambiente 3D chamado Labyrinth com 13 níveis. Em todos os jogos, o mesmo agente UNREAL é treinado da mesma forma, na saída da imagem bruta do jogo, para produzir ações para maximizar a pontuação ou recompensa do agente no jogo. O comportamento necessário para obter recompensas do jogo é incrivelmente variado, desde pegar maçãs em labirintos 3D até jogar Space Invaders – o mesmo algoritmo UNREAL aprende a jogar esses jogos muitas vezes ao nível humano e além. Alguns resultados e visualizações podem ser vistos no vídeo abaixo.

Fonte: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Carimbo de hora:

Mais de Deep Mind - última postagem