Deep Mind - najnowszy post

Uczenie się ze wzmocnieniem z nienadzorowanymi zadaniami pomocniczymi

AIZnacznik czasu: 16 listopada 2016 8:00

Węzeł źródłowy: 800709

Opublikowane ponownie przez Plato

Obserwuje: 0

Połączenie tych zadań pomocniczych wraz z naszymi poprzednimi Papier A3C jest naszym nowym agentem UNREAL (nienadzorowane wsparcie i nauka pomocnicza). Przetestowaliśmy ten agent na zestawie 57 gier Atari oraz środowisku 3D o nazwie Labyrinth z 13 poziomami. We wszystkich grach ten sam agent UNREAL jest szkolony w ten sam sposób, na surowym obrazie wyjściowym z gry, w celu wykonywania akcji maksymalizujących wynik lub nagrodę agenta w grze. Zachowanie wymagane do zdobycia nagród w grze jest niezwykle zróżnicowane, od zbierania jabłek w labiryntach 3D po granie w Space Invaders – ten sam algorytm UNREAL uczy się grać w te gry często na poziomie ludzkim i nie tylko. Niektóre wyniki i wizualizacje można zobaczyć na poniższym filmie.

Źródło: https://deepmind.com/blog/article/reinforcement-learning-unsupervised-auxiliary-tasks

Znak czasu: Listopad 16, 2016

Więcej z Deep Mind - najnowszy post

Odkrywanie tajemnic Go z AlphaGo i czołowymi graczami z Chin

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 797267

Znak czasu: Kwiecień 9, 2017

Szybkie uczenie się ze wzmocnieniem poprzez kompozycję zachowań

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 747310

Znak czasu: Październik 12, 2020

Skalowalna architektura agentów do rozproszonego szkolenia

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 752347

Znak czasu: Luty 5, 2018

Odcinek 4: AI, Robot

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 749294

Znak czasu: Sierpnia 20, 2019

Nawigacja z podobnymi do siatki reprezentacjami w sztucznych agentach

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 751323

Znak czasu: 9 maja 2018 r.

Uczenie się bez nadzoru: ciekawy uczeń

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 749902

Znak czasu: Czerwiec 25, 2019

2017: Podsumowanie roku DeepMind

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 752355

Znak czasu: Grudnia 21, 2017

Reprezentacja i rendering sceny neuronowej

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 751317

Znak czasu: Czerwiec 14, 2018

Odpowiedź DeepMind Health na raport niezależnych recenzentów 2018

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 751315

Znak czasu: Czerwiec 15, 2018

Open sourcing TRFL: biblioteka elementów wzmacniających uczących się zbrojenia

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 750609

Znak czasu: Październik 17, 2018

Zastosowanie uczenia maszynowego w przesiewowych badaniach mammograficznych w kierunku raka piersi

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 769216

Znak czasu: Listopada 23, 2017

MuZero: Mastering Go, szachy, shogi i Atari bez reguł

Klaster źródłowy:

Deep Mind - najnowszy post

Węzeł źródłowy: 747249

Znak czasu: Grudnia 23, 2020