پروکجن اور مائن آر ایل مقابلے

ماخذ نوڈ: 768080

ہمیں یہ اعلان کرتے ہوئے خوشی ہو رہی ہے کہ OpenAI دو NeurIPS 2020 مقابلوں کا اشتراک کر رہا ہے اے ہجوم, کارنتی میلان یونیورسٹی، اور Deepmind، کا استعمال کرتے ہوئے پروگین بینچ مارک اور مائن آر ایل. ہم کمک سیکھنے پر تحقیق کے لیے اندرونی طور پر ان ماحول پر بہت زیادہ انحصار کرتے ہیں، اور ہم ان چیلنجنگ مقابلوں میں کمیونٹی کی جانب سے کی جانے والی پیش رفت کو دیکھنے کے منتظر ہیں۔

پروجن مقابلہ

Procgen کے لیے سائن اپ کریں۔

۔ پروجن مقابلہ کمک سیکھنے میں نمونہ کی کارکردگی کو بہتر بنانے اور عام کرنے پر توجہ مرکوز کرتا ہے۔ شرکاء ماحول کے تعاملات کی ایک مقررہ تعداد کا استعمال کرتے ہوئے ایجنٹوں کی کارکردگی کو زیادہ سے زیادہ کرنے کی کوشش کریں گے۔ ایجنٹوں کا اندازہ ان 16 ماحول میں سے ہر ایک میں کیا جائے گا جو پہلے ہی عوامی طور پر جاری کیے گئے ہیں۔ پروگین بینچ مارککے ساتھ ساتھ اس مقابلے کے لیے خاص طور پر بنائے گئے چار خفیہ ٹیسٹ ماحول میں۔ بہت سارے متنوع ماحول میں کارکردگی کو جمع کرکے، ہم بنیادی الگورتھم کا فیصلہ کرنے کے لیے اعلیٰ معیار کے میٹرکس حاصل کرتے ہیں۔ ہر دور کی تفصیلات کے بارے میں مزید معلومات حاصل کی جا سکتی ہیں۔ یہاں.

چونکہ تمام مواد طریقہ کار سے تیار کیا جاتا ہے، اس لیے ہر پروکجن ماحول اندرونی طور پر ایجنٹوں کو ایسے حالات کو عام کرنے کا تقاضا کرتا ہے جو پہلے کبھی نہیں دیکھے گئے تھے۔ اس لیے یہ ماحول ایجنٹ کی بہت سی متنوع ترتیبات میں سیکھنے کی صلاحیت کا ایک مضبوط امتحان فراہم کرتے ہیں۔ مزید برآں، ہم نے Procgen ماحول کو تیز اور آسان استعمال کرنے کے لیے ڈیزائن کیا ہے۔ محدود کمپیوٹیشنل وسائل کے حامل شرکاء آسانی سے ہمارے بنیادی نتائج کو دوبارہ پیش کر سکیں گے اور نئے تجربات کر سکیں گے۔ ہم امید کرتے ہیں کہ یہ شرکاء کو RL میں نمونے کی کارکردگی اور عامیت کو بہتر بنانے کے لیے نئے طریقوں پر تیزی سے تکرار کرنے کے لیے بااختیار بنائے گا۔

مائن آر ایل مقابلہ

MineRL کے لیے سائن اپ کریں۔

مصنوعی ذہانت کی بہت سی حالیہ، مشہور کامیابیاں، جیسے کہ AlphaStar، AlphaGo، اور ہماری اپنی اوپن اے آئی فائیو، ترتیب وار فیصلہ سازی کے کاموں میں انسانی یا انتہائی انسانی سطح کی کارکردگی کو حاصل کرنے کے لیے گہری کمک سیکھنے کا استعمال کریں۔ جدید ترین سطح پر ہونے والی ان بہتریوں کے لیے اب تک ایک ضرورت ہے۔ تیزی سے بڑھ رہا ہے کمپیوٹ اور سمیلیٹر کے نمونوں کی مقدار، اور اس لیے ان میں سے بہت سے سسٹمز کو حقیقی دنیا کے مسائل پر براہ راست لاگو کرنا مشکل ہے جہاں ماحولیاتی نمونے مہنگے ہیں۔ ماحول کے نمونے کی پیچیدگی کو کم کرنے کا ایک معروف طریقہ یہ ہے کہ انسانی ترجیحات اور مطلوبہ رویے کے مظاہروں کا فائدہ اٹھایا جائے۔

مائن آر ایل 1 کے مقابلے میں پہلی جگہ جمع کروانے کی پیش کش جس میں لوہے کا پکیکس حاصل ہوتا ہے۔

اس سمت میں تحقیق کو مزید اتپریرک کرنے کے لیے، ہم تعاون کر رہے ہیں۔ مائن آر ایل 2020 مقابلہ جس کا مقصد الگورتھم کی ترقی کو فروغ دینا ہے جو پیچیدہ، درجہ بندی، اور ویرل ماحول کو حل کرنے کے لیے درکار نمونوں کی تعداد کو تیزی سے کم کرنے کے لیے انسانی مظاہروں کا مؤثر طریقے سے فائدہ اٹھا سکتا ہے۔ اس مقصد کے لیے، شرکاء ایسے نظاموں کو تیار کرنے کے لیے مقابلہ کریں گے جس سے ہیرا حاصل کیا جا سکے۔ Minecraft خام پکسلز سے صرف 8,000,000 نمونے استعمال کر رہے ہیں۔ مائن آر ایل سمیلیٹر اور واحد GPU مشین پر 4 دن کی تربیت۔ شرکاء کو MineRL-v0 ڈیٹاسیٹ فراہم کیا جائے گا (ویب سائٹ, کاغذ)، انسانی مظاہروں کے 60 ملین سے زیادہ فریموں کا ایک بڑے پیمانے پر مجموعہ، جو انہیں Minecraft سمیلیٹر کے ساتھ اپنے الگورتھم کے تعاملات کو کم سے کم کرنے کے لیے ماہرانہ چالوں کو استعمال کرنے کے قابل بناتا ہے۔

یہ مقابلہ ایک فالو اپ ہے۔ مائن آر ایل 2019 مقابلہ جس میں ٹاپ ٹیم کا ایجنٹ میں کر سکتا تھا ایک لوہے کا پکیکس حاصل کریں۔ (مقابلے کا حتمی مقصد) اس انتہائی محدود کمپیوٹ اور سمیلیٹر انٹرایکشن بجٹ کے تحت۔ تناظر میں دیکھیں، جدید ترین معیاری کمک سیکھنے کے نظام کو ایک ہی مقصد کو حاصل کرنے کے لیے بڑے کثیر GPU سسٹمز پر سیکڑوں ملین ماحولیاتی تعاملات کی ضرورت ہوتی ہے۔ اس سال، ہم توقع کرتے ہیں کہ حریف جدید ترین کو مزید آگے بڑھائیں گے۔

اس بات کی ضمانت دینے کے لیے کہ حریف حقیقی معنوں میں موثر الگورتھم تیار کرتے ہیں، MineRL مقابلے کے منتظمین ہارڈ ویئر، کمپیوٹ، اور دستیاب سمیلیٹر-انٹریکشن پر سخت رکاوٹوں کے ساتھ سرفہرست ٹیم کے فائنل راؤنڈ ماڈلز کو شروع سے تربیت دیتے ہیں۔ مائن آر ایل 2020 مقابلہ میں ہینڈ انجینئرنگ کی خصوصیات اور ڈومین کے اوور فٹنگ حل سے بچنے کے لیے ایک نیا پیمانہ بھی پیش کیا گیا ہے۔ مقابلے کے ڈھانچے کے بارے میں مزید تفصیلات مل سکتی ہیں۔ یہاں.

ماخذ: https://openai.com/blog/procgen-minerl-competitions/

ٹائم اسٹیمپ:

سے زیادہ اوپنائی