Deep Mind - última postagem

Aprendizado por reforço com tarefas auxiliares não supervisionadas

AICarimbo de data / hora: 16 de novembro de 2016, 8h00

Nó Fonte: 800709

Republicado por Platão

seguidores: 0

A combinação dessas tarefas auxiliares, juntamente com nossas papel A3C é o nosso novo agente UNREAL (UNsupervisioned REinforcement and Auxiliary Learning). Testamos este agente em um conjunto de 57 jogos Atari, bem como em um ambiente 3D chamado Labyrinth com 13 níveis. Em todos os jogos, o mesmo agente UNREAL é treinado da mesma forma, na saída da imagem bruta do jogo, para produzir ações para maximizar a pontuação ou recompensa do agente no jogo. O comportamento necessário para obter recompensas do jogo é incrivelmente variado, desde pegar maçãs em labirintos 3D até jogar Space Invaders – o mesmo algoritmo UNREAL aprende a jogar esses jogos muitas vezes ao nível humano e além. Alguns resultados e visualizações podem ser vistos no vídeo abaixo.

Fonte: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Carimbo de hora: 16 de novembro de 2016

Mais de Deep Mind - última postagem

Quebrando barreiras globais de acesso

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 747255

Carimbo de hora: 5 Novembro, 2020

Fortalecendo nosso compromisso com a pesquisa canadense

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 769628

Carimbo de hora: 5 de Outubro, 2017

Episódio 4: AI, Robot

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 749294

Carimbo de hora: 20 Agosto , 2019

Aprendizagem por feedback humano

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 796313

Carimbo de hora: Junho 11, 2017

Aprendizagem não supervisionada: o aluno curioso

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 749902

Carimbo de hora: Junho 25, 2019

Interfaces neurais dissociadas usando gradientes sintéticos

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 801738

Carimbo de hora: 28 Agosto , 2016

Episódio 6: IA para todos

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 749290

Carimbo de hora: 3 de setembro de 2019

Um marco para DeepMind Health and Streams

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 798631

Carimbo de hora: 26 fevereiro de 2017

Colaborar com os pacientes para obter melhores resultados

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 768056

Carimbo de hora: 18 Dezembro, 2017

O hipocampo como mapa preditivo

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 769634

Carimbo de hora: 1 de Outubro, 2017

Explorando os mistérios de Go com AlphaGo e os melhores jogadores da China

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 797267

Carimbo de hora: 9 de abril, 2017

Habilitando o aprendizado contínuo em redes neurais

Grupo de origem:

Deep Mind - última postagem

Nó Fonte: 798627

Carimbo de hora: 12 de março de 2017