Агенти, які уявляють і планують

Вихідний вузол: 794805

Тестування наших архітектур

Ми перевірили наші запропоновані архітектури на кількох завданнях, включаючи гру-головоломку Sokoban і гру з навігацією космічного корабля. Обидві ігри вимагають перспективного планування та міркування, що робить їх ідеальним середовищем для перевірки здібностей наших агентів.

  • У завданні космічного корабля агент повинен стабілізувати корабель, активуючи його двигуни фіксовану кількість разів. Він повинен боротися з гравітаційним тяжінням кількох планет, що робить його дуже нелінійним складним безперервним завданням контролю.

Щоб обмежити процес проб і помилок для обох завдань, кожен рівень генерується процедурно, і агент може спробувати його лише один раз; це заохочує агента випробувати різні стратегії «в своїй голові», перш ніж тестувати їх у реальному середовищі.

Джерело: https://deepmind.com/blog/article/agents-imagine-and-plan

Часова мітка:

Більше від Deep Mind - Останнє повідомлення