প্রোজেন এবং খনিজ প্রতিযোগিতা

উত্স নোড: 768080

আমরা ঘোষণা করতে পেরে আনন্দিত যে OpenAI এর সাথে দুটি NeurIPS 2020 প্রতিযোগিতার সহ-আয়োজন করছে AIcrowd, কার্নেগী মেলন বিশ্ববিদ্যালয়, এবং DeepMind, ব্যবহার প্রকজেন বেঞ্চমার্ক এবং মাইনআরএল. রিইনফোর্সমেন্ট লার্নিং নিয়ে গবেষণার জন্য আমরা অভ্যন্তরীণভাবে এই পরিবেশের উপর অনেক বেশি নির্ভর করি এবং আমরা এই চ্যালেঞ্জিং প্রতিযোগিতায় সম্প্রদায়ের অগ্রগতি দেখার অপেক্ষায় রয়েছি।

Procgen প্রতিযোগিতা

Procgen এর জন্য সাইন আপ করুন

সার্জারির Procgen প্রতিযোগিতা শক্তিবৃদ্ধি শেখার ক্ষেত্রে নমুনা দক্ষতা এবং সাধারণীকরণ উন্নত করার উপর দৃষ্টি নিবদ্ধ করে। অংশগ্রহণকারীরা একটি নির্দিষ্ট সংখ্যক পরিবেশের মিথস্ক্রিয়া ব্যবহার করে এজেন্টদের কর্মক্ষমতা সর্বাধিক করার চেষ্টা করবে। ইতিমধ্যেই প্রকাশ্যে প্রকাশিত 16টি পরিবেশের প্রতিটিতে এজেন্টদের মূল্যায়ন করা হবে প্রকজেন বেঞ্চমার্ক, সেইসাথে এই প্রতিযোগিতার জন্য বিশেষভাবে তৈরি চারটি গোপন পরীক্ষার পরিবেশে। অনেক বৈচিত্র্যময় পরিবেশ জুড়ে কর্মক্ষমতা একত্রিত করে, আমরা অন্তর্নিহিত অ্যালগরিদম বিচার করার জন্য উচ্চ মানের মেট্রিক্স পাই। প্রতিটি রাউন্ডের বিস্তারিত সম্পর্কে আরও তথ্য পাওয়া যাবে এখানে.

যেহেতু সমস্ত বিষয়বস্তু পদ্ধতিগতভাবে তৈরি করা হয়েছে, তাই প্রতিটি প্রোজেন পরিবেশের জন্য অভ্যন্তরীণভাবে এজেন্টদের প্রয়োজন হয় যা আগে কখনো দেখা যায়নি এমন পরিস্থিতিতে সাধারণীকরণ করা। এই পরিবেশগুলি তাই অনেক বৈচিত্র্যময় সেটিংসে শেখার জন্য এজেন্টের ক্ষমতার একটি শক্তিশালী পরীক্ষা প্রদান করে। অধিকন্তু, আমরা Procgen পরিবেশগুলিকে দ্রুত এবং সহজ ব্যবহার করার জন্য ডিজাইন করেছি৷ সীমিত গণনামূলক সংস্থান সহ অংশগ্রহণকারীরা সহজেই আমাদের বেসলাইন ফলাফলগুলি পুনরুত্পাদন করতে এবং নতুন পরীক্ষা চালাতে সক্ষম হবে। আমরা আশা করি যে এটি অংশগ্রহণকারীদের নমুনা দক্ষতা এবং RL-এ সাধারণীকরণ উন্নত করার জন্য নতুন পদ্ধতিতে দ্রুত পুনরাবৃত্তি করতে সক্ষম করবে।

মাইনআরএল প্রতিযোগিতা

MineRL এর জন্য সাইন আপ করুন

কৃত্রিম বুদ্ধিমত্তার সাম্প্রতিক অনেক পালিত সাফল্য, যেমন AlphaStar, AlphaGo এবং আমাদের নিজস্ব OpenAI ফাইভ, ক্রমিক সিদ্ধান্ত গ্রহণের কাজগুলিতে মানব বা অতি-মানবীয় স্তরের কর্মক্ষমতা অর্জনের জন্য গভীর শক্তিবৃদ্ধি শেখার ব্যবহার করুন। অত্যাধুনিক এই উন্নতির জন্য এখন পর্যন্ত একটি প্রয়োজন দ্রুতগতিতে বৃদ্ধি পাচ্ছে কম্পিউট এবং সিমুলেটর নমুনার পরিমাণ, এবং তাই এই সিস্টেমগুলির অনেকগুলিকে বাস্তব-বিশ্বের সমস্যাগুলিতে সরাসরি প্রয়োগ করা কঠিন যেখানে পরিবেশের নমুনাগুলি ব্যয়বহুল। পরিবেশের নমুনা জটিলতা কমানোর একটি সুপরিচিত উপায় হল মানুষের পূর্ববর্তী এবং পছন্দসই আচরণের প্রদর্শনের সুবিধা নেওয়া।

MineRL 1 প্রতিযোগিতা থেকে 2019ম স্থান জমা দেওয়ার একটি রেন্ডারিং একটি লোহার পিক্যাক্স পাওয়া।

এই দিকে গবেষণাকে আরও অনুঘটক করার জন্য, আমরা সহ-সংগঠিত করছি MineRL 2020 প্রতিযোগিতা যার লক্ষ্য হল অ্যালগরিদমগুলির বিকাশকে উত্সাহিত করা যা দক্ষতার সাথে মানুষের বিক্ষোভগুলিকে জটিল, শ্রেণিবদ্ধ, এবং বিক্ষিপ্ত পরিবেশগুলি সমাধান করার জন্য প্রয়োজনীয় নমুনার সংখ্যাকে মারাত্মকভাবে হ্রাস করতে পারে। সেই লক্ষ্যে, অংশগ্রহণকারীরা এমন সিস্টেম বিকাশের জন্য প্রতিযোগিতা করবে যা একটি হীরা পেতে পারে minecraft থেকে শুধুমাত্র 8,000,000 নমুনা ব্যবহার করে কাঁচা পিক্সেল থেকে মাইনআরএল সিমুলেটর এবং একটি একক GPU মেশিনে 4 দিনের প্রশিক্ষণ। অংশগ্রহণকারীদের MineRL-v0 ডেটাসেট প্রদান করা হবে (ওয়েবসাইট, কাগজ), মানব প্রদর্শনের 60 মিলিয়নেরও বেশি ফ্রেমের একটি বৃহৎ আকারের সংগ্রহ, Minecraft সিমুলেটরের সাথে তাদের অ্যালগরিদমের মিথস্ক্রিয়া কমিয়ে আনতে বিশেষজ্ঞের ট্র্যাজেক্টোরি ব্যবহার করতে সক্ষম করে।

এই প্রতিযোগিতা একটি ফলো-আপ MineRL 2019 প্রতিযোগিতা যা শীর্ষ দলের এজেন্ট সক্ষম ছিল একটি লোহার পিক্যাক্স পান (প্রতিযোগিতার শেষ লক্ষ্য) এই অত্যন্ত সীমিত গণনা এবং সিমুলেটর-মিথস্ক্রিয়া বাজেটের অধীনে। পরিপ্রেক্ষিতে বলা যায়, অত্যাধুনিক স্ট্যান্ডার্ড রিইনফোর্সমেন্ট লার্নিং সিস্টেমের জন্য একই লক্ষ্য অর্জনের জন্য বৃহৎ মাল্টি-জিপিইউ সিস্টেমে কয়েক মিলিয়ন পরিবেশের মিথস্ক্রিয়া প্রয়োজন। এই বছর, আমরা আশা করি প্রতিযোগীরা অত্যাধুনিক-কে আরও এগিয়ে নিয়ে যাবে।

প্রতিযোগীরা যে সত্যিকারের নমুনা দক্ষ অ্যালগরিদম তৈরি করে তার গ্যারান্টি দেওয়ার জন্য, MineRL প্রতিযোগিতার আয়োজকরা হার্ডওয়্যার, গণনা, এবং সিমুলেটর-মিথস্ক্রিয়া উপলব্ধের উপর কঠোর সীমাবদ্ধতার সাথে প্রথম থেকে শীর্ষ দলের চূড়ান্ত রাউন্ড মডেলগুলিকে প্রশিক্ষণ দেয়। MineRL 2020 প্রতিযোগিতায় হ্যান্ড ইঞ্জিনিয়ারিং বৈশিষ্ট্য এবং ডোমেনে অতিরিক্ত ফিটিং সমাধানগুলি এড়াতে একটি অভিনব পরিমাপও রয়েছে৷ প্রতিযোগিতার কাঠামো সম্পর্কে আরও বিশদ পাওয়া যাবে এখানে.

সূত্র: https://openai.com/blog/procgen-minerl-competitions/

সময় স্ট্যাম্প:

থেকে আরো OpenAI