Deep Mind - Seneste indlæg

Forstærkende læring med uovervågede hjælpeopgaver

AITidsstempel: 16. november 2016 kl. 8:00

Kildeknude: 800709

Genudgivet af Platon

Abonnenter: 0

Kombinationen af disse hjælpeopgaver sammen med vores tidligere A3C papir er vores nye UNREAL agent (UNsupervised REinforcement and Auxiliary Learning). Vi testede denne agent på en suite af 57 Atari-spil samt et 3D-miljø kaldet Labyrinth med 13 niveauer. I alle spillene trænes den samme UNREAL agent på samme måde, på det rå billedoutput fra spillet, til at producere handlinger for at maksimere scoren eller belønningen for agenten i spillet. Den adfærd, der kræves for at få spilbelønninger, er utrolig varieret, fra at samle æbler i 3D-labyrinter til at spille Space Invaders – den samme URIGTIGE algoritme lærer at spille disse spil ofte til menneskeligt niveau og videre. Nogle resultater og visualiseringer kan ses i videoen nedenfor.

Kilde: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Tidsstempel: November 16, 2016

Mere fra Deep Mind - Seneste indlæg

DeepMind og Blizzard udgiver StarCraft II som et AI-forskningsmiljø

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 800711

Tidsstempel: November 3, 2016

Spilteori indsigt i asymmetriske multi-agent spil

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 752353

Tidsstempel: Jan 17, 2018

Afkoblede neurale grænseflader ved hjælp af syntetiske gradienter

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 801738

Tidsstempel: August 28, 2016

Bruger JAX til at accelerere vores forskning

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 747251

Tidsstempel: December 4, 2020

At sætte patienter i hjertet af DeepMind Health

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 801732

Tidsstempel: September 20, 2016

Annoncering af partnerskabet om kunstig intelligens til gavn for mennesker og samfund

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 801730

Tidsstempel: September 27, 2016

Open sourcing TRFL: et bibliotek med byggeklodser for forstærkende læring

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 750609

Tidsstempel: Oktober 17, 2018

WaveNet: En generativ model til rå lyd

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 801734

Tidsstempel: September 7, 2016

Brug af AI til at forudsige retinal sygdomsprogression

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 747316

Tidsstempel: Maj 18, 2020

TF-replikator: Distribueret maskinlæring for forskere

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 749908

Tidsstempel: Mar 7, 2019

Causal Bayesian Networks: Et fleksibelt værktøj til at muliggøre mere retfærdig maskinlæring

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 748946

Tidsstempel: Oktober 3, 2019

DeepMind, mød Android

Kildeklynge:

Deep Mind - Seneste indlæg

Kildeknude: 751628

Tidsstempel: Maj 8, 2018