2023 সালে পড়ার জন্য সেরা মেশিন লার্নিং পেপার

2023 সালে পড়ার জন্য সেরা মেশিন লার্নিং পেপার

উত্স নোড: 2016455

2023 সালে পড়ার জন্য সেরা মেশিন লার্নিং পেপার
দ্বারা চিত্র pch.vector on Freepik
 

মেশিন লার্নিং একটি বড় ক্ষেত্র যেখানে নতুন গবেষণা ঘন ঘন আসছে। এটি একটি উত্তপ্ত ক্ষেত্র যেখানে একাডেমিয়া এবং শিল্প আমাদের দৈনন্দিন জীবন উন্নত করার জন্য নতুন জিনিস নিয়ে পরীক্ষা চালিয়ে যাচ্ছে।

সাম্প্রতিক বছরগুলিতে, মেশিন লার্নিং প্রয়োগের কারণে জেনারেটিভ এআই বিশ্বকে পরিবর্তন করছে। উদাহরণস্বরূপ, ChatGPT এবং স্টেবল ডিফিউশন। এমনকি 2023 সালে জেনারেটিভ AI দ্বারা আধিপত্য থাকা সত্ত্বেও, আমাদের আরও অনেক মেশিন লার্নিং ব্রেকথ্রু সম্পর্কে সচেতন হওয়া উচিত।

এখানে 2023 সালে পড়ার জন্য সেরা মেশিন লার্নিং পেপার রয়েছে যাতে আপনি আসন্ন প্রবণতাগুলি মিস করবেন না।

1) গানে সৌন্দর্য শেখা: নিউরাল সিঙ্গিং ভয়েস বিউটিফায়ার

সিংগিং ভয়েস বিউটিফাইং (SVB) হল জেনারেটিভ AI-তে একটি অভিনব কাজ যার লক্ষ্য হল অপেশাদার গানের ভয়েসকে সুন্দর করে তোলা। এটা ঠিক গবেষণা লক্ষ্য লিউ এট আল। (2022) যখন তারা নিউরাল সিংগিং ভয়েস বিউটিফায়ার (NSVB) নামে একটি নতুন জেনারেটিভ মডেলের প্রস্তাব করেছিল। 

NSVB হল একটি অর্ধ-তত্ত্বাবধান করা শেখার মডেল যা একটি সুপ্ত-ম্যাপিং অ্যালগরিদম ব্যবহার করে যা পিচ সংশোধনকারী হিসাবে কাজ করে এবং কণ্ঠস্বরকে উন্নত করে। কাজটি বাদ্যযন্ত্র শিল্পকে উন্নত করার প্রতিশ্রুতি দেয় এবং এটি পরীক্ষা করার মতো।

2) অপ্টিমাইজেশান অ্যালগরিদমের প্রতীকী আবিষ্কার

গভীর নিউরাল নেটওয়ার্ক মডেল আগের চেয়ে বড় হয়ে উঠেছে, এবং প্রশিক্ষণ প্রক্রিয়া সহজ করার জন্য অনেক গবেষণা করা হয়েছে। গুগল দলের সাম্প্রতিক গবেষণা (চেন এট আল। (2023)) লায়ন (EvoLved সাইন মোমেন্টাম) নামক নিউরাল নেটওয়ার্কের জন্য একটি নতুন অপ্টিমাইজেশনের প্রস্তাব করেছে। পদ্ধতিটি দেখায় যে অ্যালগরিদমটি আরও মেমরি-দক্ষ এবং অ্যাডামের চেয়ে ছোট শেখার হার প্রয়োজন। এটি একটি দুর্দান্ত গবেষণা যা অনেক প্রতিশ্রুতি দেখায় যা আপনার মিস করা উচিত নয়।

3) TimesNet: সাধারণ সময় সিরিজ বিশ্লেষণের জন্য টেম্পোরাল 2D-ভেরিয়েশন মডেলিং

সময় সিরিজ বিশ্লেষণ অনেক ব্যবসায় একটি সাধারণ ব্যবহার ক্ষেত্রে; উদাহরণস্বরূপ, মূল্য পূর্বাভাস, অসঙ্গতি সনাক্তকরণ, ইত্যাদি। তবে, শুধুমাত্র বর্তমান ডেটা (1D ডেটা) এর উপর ভিত্তি করে অস্থায়ী ডেটা বিশ্লেষণ করার জন্য অনেক চ্যালেঞ্জ রয়েছে। এই কারণে উ এট আল। (2023) 1D ডেটাকে 2D ডেটাতে রূপান্তর করার জন্য TimesNet নামে একটি নতুন পদ্ধতির প্রস্তাব করুন, যা পরীক্ষায় দুর্দান্ত পারফরম্যান্স অর্জন করে। এই নতুন পদ্ধতিটি আরও ভালভাবে বুঝতে আপনার কাগজটি পড়া উচিত কারণ এটি ভবিষ্যতের সময় সিরিজ বিশ্লেষণে অনেক সাহায্য করবে।

4) OPT: প্রাক-প্রশিক্ষিত ট্রান্সফরমার ভাষা মডেল খুলুন

বর্তমানে, আমরা একটি জেনারেটিভ এআই যুগে রয়েছি যেখানে অনেক বড় ভাষার মডেল কোম্পানিগুলি নিবিড়ভাবে তৈরি করেছে। বেশিরভাগ এই ধরনের গবেষণা তাদের মডেল প্রকাশ করবে না বা শুধুমাত্র বাণিজ্যিকভাবে উপলব্ধ হবে। যাইহোক, মেটা এআই গবেষণা গ্রুপ (ঝাং এট আল। (2022)) ওপেন প্রি-ট্রেইনড ট্রান্সফরমার (OPT) মডেল প্রকাশ করে উল্টোটা করার চেষ্টা করে যা GPT-3 এর সাথে তুলনীয় হতে পারে। কাগজটি OPT মডেল এবং গবেষণার বিশদটি বোঝার জন্য একটি দুর্দান্ত শুরু, কারণ দলটি কাগজে সমস্ত বিবরণ লগ করে।

5) REaLTabFormer: ট্রান্সফরমার ব্যবহার করে বাস্তবসম্মত রিলেশনাল এবং ট্যাবুলার ডেটা তৈরি করা

জেনারেটিভ মডেল শুধুমাত্র টেক্সট বা ছবি তৈরি করার জন্যই সীমাবদ্ধ নয় বরং ট্যাবুলার ডেটাও। এই উৎপন্ন ডেটাকে প্রায়ই সিন্থেটিক ডেটা বলা হয়। সিন্থেটিক ট্যাবুলার ডেটা জেনারেট করার জন্য অনেক মডেল তৈরি করা হয়েছিল, কিন্তু রিলেশনাল ট্যাবুলার সিন্থেটিক ডেটা জেনারেট করার জন্য প্রায় কোনও মডেল নেই। এই ঠিক উদ্দেশ্য সোলাটোরিও এবং ডুপ্রিজ (2023) গবেষণা সিন্থেটিক রিলেশনাল ডেটার জন্য REaLTabFormer নামে একটি মডেল তৈরি করা। পরীক্ষাটি দেখিয়েছে যে ফলাফলটি বিদ্যমান সিন্থেটিক মডেলের সঠিকভাবে কাছাকাছি, যা অনেক অ্যাপ্লিকেশনগুলিতে প্রসারিত হতে পারে।

6) প্রাকৃতিক ভাষা প্রক্রিয়াকরণের জন্য কি রিইনফোর্সমেন্ট লার্নিং (না)?: প্রাকৃতিক ভাষা নীতি অপ্টিমাইজেশানের জন্য বেঞ্চমার্ক, বেসলাইন এবং বিল্ডিং ব্লক

প্রাকৃতিক ভাষা প্রক্রিয়াকরণ কাজের জন্য ধারণাগতভাবে শক্তিবৃদ্ধি শিক্ষা একটি চমৎকার পছন্দ, কিন্তু এটা কি সত্য? এটি একটি প্রশ্ন যে রামামূর্তি ও অন্যান্য। (2022) উত্তর দেওয়ার চেষ্টা করুন। গবেষক বিভিন্ন লাইব্রেরি এবং অ্যালগরিদম প্রবর্তন করেন যা দেখায় যে NLP কার্যগুলিতে তত্ত্বাবধান করা পদ্ধতির তুলনায় শক্তিবৃদ্ধি শেখার কৌশলগুলির একটি প্রান্ত রয়েছে৷ আপনি যদি আপনার দক্ষতার জন্য বিকল্প চান তবে এটি পড়ার জন্য একটি প্রস্তাবিত কাগজ।

7) টিউন-এ-ভিডিও: টেক্সট-টু-ভিডিও জেনারেশনের জন্য ইমেজ ডিফিউশন মডেলের এক-শট টিউনিং

টেক্সট-টু-ইমেজ জেনারেশন 2022 সালে বড় ছিল এবং 2023 টেক্সট-টু-ভিডিও (T2V) ক্ষমতার উপর প্রজেক্ট করা হবে। দ্বারা গবেষণা উ এট আল। (2022) দেখায় কিভাবে T2V অনেক পদ্ধতিতে প্রসারিত করা যেতে পারে। গবেষণাটি একটি নতুন টিউন-এ-ভিডিও পদ্ধতির প্রস্তাব করে যা T2V কাজগুলিকে সমর্থন করে যেমন বিষয় এবং বস্তুর পরিবর্তন, শৈলী স্থানান্তর, বৈশিষ্ট্য সম্পাদনা ইত্যাদি। আপনি পাঠ্য থেকে ভিডিও গবেষণায় আগ্রহী হলে এটি পড়ার জন্য একটি দুর্দান্ত কাগজ।

8) PyGlove: কোড হিসাবে দক্ষতার সাথে ML ধারনা বিনিময়

দক্ষ সহযোগিতা যে কোনো দলের সাফল্যের চাবিকাঠি, বিশেষ করে মেশিন লার্নিং ক্ষেত্রের মধ্যে ক্রমবর্ধমান জটিলতার সাথে। দক্ষতা বৃদ্ধি করতে, পেং এট আল। (2023) এমএল ধারণাগুলি সহজেই ভাগ করতে একটি পাইগ্লোভ লাইব্রেরি উপস্থাপন করুন। PyGlove ধারণাটি প্যাচিং নিয়মগুলির একটি তালিকার মাধ্যমে এমএল গবেষণার প্রক্রিয়াটি ক্যাপচার করা। তালিকাটি তারপরে যেকোনো পরীক্ষার দৃশ্যে পুনরায় ব্যবহার করা যেতে পারে, যা দলের দক্ষতা উন্নত করে। এটি এমন একটি গবেষণা যা একটি মেশিন লার্নিং সমস্যা সমাধান করার চেষ্টা করে যা অনেকে এখনও করেনি, তাই এটি পড়ার মূল্য।

8) ChatGPT মানব বিশেষজ্ঞদের কতটা কাছাকাছি? তুলনা করপাস, মূল্যায়ন, এবং সনাক্তকরণ

চ্যাটজিপিটি পৃথিবীকে অনেক বদলে দিয়েছে। এটা বলা নিরাপদ যে এখান থেকে প্রবণতা ঊর্ধ্বমুখী হবে কারণ জনসাধারণ ইতিমধ্যেই ChatGPT ব্যবহারের পক্ষে। যাইহোক, ChatGPT বর্তমান ফলাফল মানব বিশেষজ্ঞদের তুলনায় কিভাবে? এটা ঠিক একটি প্রশ্ন যে গুও এট আল। (2023) উত্তর দেওয়ার চেষ্টা করুন। দলটি বিশেষজ্ঞদের কাছ থেকে তথ্য সংগ্রহ করার চেষ্টা করেছে এবং ChatGPT প্রম্পট ফলাফল, যা তারা তুলনা করেছে। ফলাফল দেখায় যে ChatGPT এবং বিশেষজ্ঞদের মধ্যে অন্তর্নিহিত পার্থক্য ছিল। গবেষণাটি এমন একটি বিষয় যা আমি মনে করি ভবিষ্যতে জিজ্ঞাসা করা হবে কারণ জেনারেটিভ এআই মডেল সময়ের সাথে সাথে বাড়তে থাকবে, তাই এটি পড়ার যোগ্য।

2023 বর্তমান প্রবণতা দ্বারা দেখানো মেশিন লার্নিং গবেষণার জন্য একটি দুর্দান্ত বছর, বিশেষ করে ChatGPT এবং স্টেবল ডিফিউশনের মতো জেনারেটিভ এআই। অনেক আশাব্যঞ্জক গবেষণা রয়েছে যা আমি মনে করি আমাদের মিস করা উচিত নয় কারণ এটি প্রতিশ্রুতিশীল ফলাফল দেখানো হয়েছে যা বর্তমান মান পরিবর্তন করতে পারে। এই নিবন্ধে, আমি আপনাকে জেনারেটিভ মডেল, টাইম সিরিজ মডেল থেকে ওয়ার্কফ্লো দক্ষতা পর্যন্ত পড়ার জন্য 9টি শীর্ষ ML পেপার দেখিয়েছি। আমি আসা করি এটা সাহায্য করবে.
 
 
কর্নেলিয়াস যুধা বিজয়া একজন ডেটা বিজ্ঞান সহকারী ব্যবস্থাপক এবং ডেটা লেখক। আলিয়াঞ্জ ইন্দোনেশিয়াতে পূর্ণ-সময় কাজ করার সময়, তিনি সোশ্যাল মিডিয়া এবং লেখার মাধ্যমে পাইথন এবং ডেটা টিপস শেয়ার করতে পছন্দ করেন।
 

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস