Procgen ve MineRL Yarışmaları

Kaynak Düğüm: 768080

OpenAI'nin iki NeurIPS 2020 yarışmasını birlikte düzenlediğini duyurmaktan heyecan duyuyoruz Kalabalık, Carnegie Mellon University, ve DeepMindKullanılarak Procgen Deneyleri ve MadenRL. Takviyeli öğrenim araştırmaları için şirket içinde bu ortamlara büyük ölçüde güveniyoruz ve topluluğun bu zorlu yarışmalarda kaydettiği ilerlemeyi görmek için sabırsızlanıyoruz.

Procgen Yarışması

Procgen'e kaydolun

The Procgen Yarışması Takviyeli öğrenmede örnek verimliliğinin ve genellemenin iyileştirilmesine odaklanır. Katılımcılar, sabit sayıda ortam etkileşimi kullanarak aracıların performansını en üst düzeye çıkarmaya çalışacaklardır. Aracılar halihazırda kamuya açıklanmış olan 16 ortamın her birinde değerlendirilecektir. Procgen Deneylerive bu yarışma için özel olarak oluşturulan dört gizli test ortamında. Pek çok farklı ortamdaki performansı bir araya getirerek, temel algoritmaları değerlendirmek için yüksek kaliteli ölçümler elde ediyoruz. Her turun ayrıntıları hakkında daha fazla bilgiyi burada bulabilirsiniz. okuyun.

Tüm içerik prosedürel olarak oluşturulduğundan, her Procgen ortamı doğası gereği aracıların daha önce hiç görülmemiş durumlara genelleme yapmasını gerektirir. Dolayısıyla bu ortamlar, bir aracının birçok farklı ortamda öğrenme yeteneğinin sağlam bir testini sağlar. Üstelik Procgen ortamlarını hızlı ve kullanımı basit olacak şekilde tasarladık. Sınırlı hesaplama kaynaklarına sahip katılımcılar, temel sonuçlarımızı kolayca yeniden üretebilecek ve yeni deneyler gerçekleştirebilecek. Bunun, katılımcıların RL'de örnek verimliliğini ve genellemeyi geliştirmeye yönelik yeni yöntemleri hızlı bir şekilde yinelemelerine olanak sağlayacağını umuyoruz.

MineRL Yarışması

MineRL'e kaydolun

AlphaStar, AlphaGo ve bizimki gibi yapay zekanın yakın zamandaki ünlü başarılarının çoğu OpenAI Beş, sıralı karar verme görevlerinde insan veya insanüstü düzeyde performans elde etmek için derin takviyeli öğrenmeden yararlanın. En son teknolojideki bu iyileştirmeler şu ana kadar bir katlanarak artan çok fazla hesaplama ve simülatör örneği vardır ve bu nedenle bu sistemlerin birçoğunun, ortam örneklerinin pahalı olduğu gerçek dünya sorunlarına doğrudan uygulanması zordur. Ortam örneği karmaşıklığını azaltmanın iyi bilinen bir yolu, insanın önceliklerinden ve istenen davranışın gösterilerinden yararlanmaktır.

MineRL 1 yarışmasında demir kazma alan 2019. sırayı gösteren bir çizim.

Bu yöndeki araştırmaları daha fazla katalize etmek için ortaklaşa organize ediyoruz. MineRL 2020 Yarışması karmaşık, hiyerarşik ve seyrek ortamları çözmek için gereken örnek sayısını büyük ölçüde azaltmak amacıyla insan gösterilerinden etkin bir şekilde yararlanabilecek algoritmaların geliştirilmesini teşvik etmeyi amaçlamaktadır. Bu amaçla katılımcılar, elmas elde edebilecek sistemler geliştirmek için yarışacaklar. Minecraft yalnızca 8,000,000 örnek kullanılarak ham piksellerden elde edilmiştir. MineRL simülatörü ve tek bir GPU makinesinde 4 günlük eğitim. Katılımcılara MineRL-v0 veri seti sağlanacaktır (Web sitesi, kâğıt), 60 milyondan fazla insan gösterisi karesinden oluşan geniş ölçekli bir koleksiyon, algoritmalarının Minecraft simülatörüyle etkileşimlerini en aza indirmek için uzman yörüngelerden yararlanmalarına olanak tanıyor.

Bu yarışma, bu yarışmanın devamı niteliğindedir. MineRL 2019 Yarışması içinde en iyi takımın menajeri başardı demir kazma al (yarışmanın sondan bir önceki hedefi) bu son derece sınırlı bilgi işlem ve simülatör etkileşimi bütçesi altında. Perspektiften bakıldığında, en son teknolojiye sahip standart takviyeli öğrenme sistemleri, aynı hedefe ulaşmak için büyük çoklu GPU sistemlerinde yüz milyonlarca ortam etkileşimini gerektirir. Bu yıl rakiplerin en son teknolojiyi daha da ileri taşıyacağını öngörüyoruz.

Rakiplerin gerçekten örnek verimli algoritmalar geliştirmesini garanti etmek için MineRL yarışma organizatörleri, en iyi takımın son tur modellerini mevcut donanım, bilgi işlem ve simülatör etkileşimi üzerindeki katı kısıtlamalarla sıfırdan eğitiyor. MineRL 2020 Yarışması aynı zamanda el mühendisliği özelliklerinden ve alana aşırı uyum sağlayan çözümlerden kaçınmak için yeni bir önlem de içeriyor. Yarışma yapısına ilişkin daha fazla ayrıntıyı burada bulabilirsiniz okuyun.

Kaynak: https://openai.com/blog/procgen-minerl-competitions/

Zaman Damgası:

Den fazla OpenAI