Deep Mind - Ultimo post

Apprendimento di rinforzo con compiti ausiliari non supervisionati

AITimestamp: 16 novembre 2016 8:00

Nodo di origine: 800709

Ripubblicato da Platone

Seguaci: 0

La combinazione di questi compiti ausiliari, insieme al nostro precedente Carta A3C è il nostro nuovo agente UNREAL (UNsupervised REinforcement and Auxiliary Learning). Abbiamo testato questo agente su una suite di 57 giochi Atari e su un ambiente 3D chiamato Labyrinth con 13 livelli. In tutti i giochi, lo stesso agente UNREAL viene addestrato allo stesso modo, sull'immagine grezza prodotta dal gioco, per produrre azioni per massimizzare il punteggio o la ricompensa dell'agente nel gioco. Il comportamento richiesto per ottenere ricompense di gioco è incredibilmente vario, dal raccogliere mele nei labirinti 3D al giocare a Space Invaders: lo stesso algoritmo UNREAL impara a giocare a questi giochi spesso a livello umano e oltre. Alcuni risultati e visualizzazioni possono essere visti nel video qui sotto.

Fonte: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Timestamp: 16 Novembre 2016

Di più da Deep Mind - Ultimo post

L'ippocampo come mappa predittiva

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 769634

Timestamp: Ottobre 1, 2017

Comprensione della cooperazione tra agenti

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 798633

Timestamp: Febbraio 8, 2017

AI e Neuroscience: un circolo virtuoso

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 788495

Timestamp: 1 agosto 2017

Torna a Parigi / Un ritorno a Parigi

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 751634

Timestamp: marzo 29, 2018

Utilizzo della tecnologia WaveNet per riunire gli utenti con problemi di linguaggio con le loro voci originali

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 748587

Timestamp: Dicembre 18, 2019

Perché abbiamo lanciato DeepMind Ethics & Society

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 769632

Timestamp: Ottobre 2, 2017

Episodio 2: Go to Zero

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 749591

Timestamp: 18 agosto 2019

WaveNet si avvia in Google Assistant

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 769630

Timestamp: Ottobre 3, 2017

Richiesta di ruoli tecnici

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 747314

Timestamp: 23 giugno 2020

Abbattere le barriere globali all'accesso

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 747255

Timestamp: Novembre 5, 2020

Miglioramento della sicurezza dei pazienti presso Taunton e Somerset NHS Foundation Trust

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 796311

Timestamp: 20 giugno 2017

La prossima mossa di AlphaGo

Cluster di origine:

Deep Mind - Ultimo post

Nodo di origine: 797263

Timestamp: 26 Maggio 2017