2023 में पढ़ने के लिए टॉप मशीन लर्निंग पेपर्स

2023 में पढ़ने के लिए टॉप मशीन लर्निंग पेपर्स

स्रोत नोड: 2016455

2023 में पढ़ने के लिए टॉप मशीन लर्निंग पेपर्स
छवि द्वारा पीसी.वेक्टर on Freepik
 

मशीन लर्निंग एक बड़ा क्षेत्र है जिसमें नए शोध अक्सर सामने आते रहते हैं। यह एक गर्म क्षेत्र है जहां अकादमिक और उद्योग हमारे दैनिक जीवन को बेहतर बनाने के लिए नई चीजों के साथ प्रयोग करते रहते हैं।

हाल के वर्षों में, मशीन लर्निंग के अनुप्रयोग के कारण जनरेटिव एआई दुनिया को बदल रहा है। उदाहरण के लिए, चैटजीपीटी और स्थिर प्रसार। यहां तक ​​कि 2023 में जनरेटिव एआई का वर्चस्व होने के बावजूद, हमें कई और मशीन लर्निंग सफलताओं के बारे में पता होना चाहिए।

यहां 2023 में पढ़ने के लिए शीर्ष मशीन लर्निंग पेपर हैं ताकि आप आगामी रुझानों को याद न करें।

1) लर्निंग द ब्यूटी इन सांग्स: न्यूरल सिंगिंग वॉयस ब्यूटीफायर

सिंगिंग वॉयस ब्यूटीफाइंग (एसवीबी) जनरेटिव एआई में एक नया काम है जिसका उद्देश्य शौकिया गायन आवाज को एक सुंदर में सुधारना है। यह बिल्कुल अनुसंधान का उद्देश्य है लियू एट अल। (2022) जब उन्होंने न्यूरल सिंगिंग वॉयस ब्यूटीफायर (NSVB) नामक एक नया जनरेटिव मॉडल प्रस्तावित किया। 

NSVB एक अर्ध-पर्यवेक्षित शिक्षण मॉडल है जो एक अव्यक्त-मानचित्रण एल्गोरिथ्म का उपयोग करता है जो पिच सुधारक के रूप में कार्य करता है और मुखर स्वर में सुधार करता है। काम संगीत उद्योग को बेहतर बनाने का वादा करता है और जाँच के लायक है।

2) अनुकूलन एल्गोरिदम की प्रतीकात्मक खोज

डीप न्यूरल नेटवर्क मॉडल पहले से कहीं ज्यादा बड़े हो गए हैं और प्रशिक्षण प्रक्रिया को आसान बनाने के लिए काफी शोध किए गए हैं। Google टीम द्वारा हालिया शोध (चेन एट अल। (2023)) ने लायन (EvoLved Sign Momentum) नामक तंत्रिका नेटवर्क के लिए एक नया अनुकूलन प्रस्तावित किया है। विधि से पता चलता है कि एल्गोरिथ्म अधिक मेमोरी-कुशल है और एडम की तुलना में कम सीखने की दर की आवश्यकता होती है। यह बहुत अच्छा शोध है जो ऐसे कई वादे दिखाता है जिन्हें आपको छोड़ना नहीं चाहिए।

3) टाइम्सनेट: सामान्य समय श्रृंखला विश्लेषण के लिए टेम्पोरल 2डी-वैरिएशन मॉडलिंग

समय श्रृंखला विश्लेषण कई व्यवसायों में एक सामान्य उपयोग का मामला है; उदाहरण के लिए, मूल्य पूर्वानुमान, विसंगति का पता लगाना आदि। हालांकि, केवल वर्तमान डेटा (1डी डेटा) के आधार पर अस्थायी डेटा का विश्लेषण करने में कई चुनौतियाँ हैं। इस कर वू एट अल। (2023) 1डी डेटा को 2डी डेटा में बदलने के लिए टाइम्सनेट नामक एक नई विधि प्रस्तावित करें, जो प्रयोग में शानदार प्रदर्शन हासिल करती है। इस नई पद्धति को बेहतर ढंग से समझने के लिए आपको पेपर पढ़ना चाहिए क्योंकि इससे भविष्य की समय श्रृंखला विश्लेषण में काफी मदद मिलेगी।

4) ऑप्ट: पूर्व-प्रशिक्षित ट्रांसफॉर्मर भाषा मॉडल खोलें

वर्तमान में, हम एक पीढ़ीगत एआई युग में हैं जहां कंपनियों द्वारा कई बड़े भाषा मॉडल गहन रूप से विकसित किए गए थे। ज्यादातर इस तरह के शोध उनके मॉडल को जारी नहीं करेंगे या केवल व्यावसायिक रूप से उपलब्ध होंगे। हालाँकि, मेटा एआई अनुसंधान समूह (झांग एट अल। (2022)) ओपन प्री-ट्रेन्ड ट्रांसफॉर्मर्स (ऑप्ट) मॉडल को सार्वजनिक रूप से जारी करके विपरीत करने की कोशिश करता है जो कि GPT-3 के साथ तुलनीय हो सकता है। पेपर ऑप्ट मॉडल और शोध विवरण को समझने के लिए एक शानदार शुरुआत है, क्योंकि समूह पेपर में सभी विवरणों को लॉग करता है।

5) REaLTabFormer: ट्रांसफॉर्मर का उपयोग करके यथार्थवादी संबंधपरक और सारणीबद्ध डेटा उत्पन्न करना

जनरेटिव मॉडल केवल टेक्स्ट या चित्र बनाने तक ही सीमित नहीं है बल्कि सारणीबद्ध डेटा भी है। इस उत्पन्न डेटा को अक्सर सिंथेटिक डेटा कहा जाता है। सिंथेटिक सारणीबद्ध डेटा उत्पन्न करने के लिए कई मॉडल विकसित किए गए थे, लेकिन संबंधपरक सारणीबद्ध सिंथेटिक डेटा उत्पन्न करने के लिए लगभग कोई मॉडल नहीं था। बिल्कुल यही उद्देश्य है सोलाटोरियो और डुप्रीज़ (2023) शोध करना; सिंथेटिक रिलेशनल डेटा के लिए REaLTabFormer नामक मॉडल बनाना। प्रयोग से पता चला है कि परिणाम मौजूदा सिंथेटिक मॉडल के करीब है, जिसे कई अनुप्रयोगों तक बढ़ाया जा सकता है।

6) प्राकृतिक भाषा प्रसंस्करण के लिए सुदृढीकरण सीखना (नहीं) है ?: प्राकृतिक भाषा नीति अनुकूलन के लिए बेंचमार्क, बेसलाइन और बिल्डिंग ब्लॉक्स

सुदृढीकरण सीखना वैचारिक रूप से प्राकृतिक भाषा प्रसंस्करण कार्य के लिए एक उत्कृष्ट विकल्प है, लेकिन क्या यह सच है? यह एक ऐसा प्रश्न है राममूर्ति एट अल। (2022) उत्तर देने का प्रयास करें। शोधकर्ता विभिन्न पुस्तकालय और एल्गोरिथ्म का परिचय देता है जो दिखाता है कि एनएलपी कार्यों में पर्यवेक्षित विधि की तुलना में सुदृढीकरण सीखने की तकनीक में कहाँ बढ़त है। यदि आप अपने कौशल के लिए एक विकल्प चाहते हैं तो यह पढ़ने के लिए अनुशंसित पेपर है।

7) ट्यून-ए-वीडियो: टेक्स्ट-टू-वीडियो जनरेशन के लिए इमेज डिफ्यूजन मॉडल की एक-शॉट ट्यूनिंग

2022 में टेक्स्ट-टू-इमेज जनरेशन बड़ा था, और 2023 को टेक्स्ट-टू-वीडियो (T2V) क्षमता पर पेश किया जाएगा। द्वारा अनुसंधान वू एट अल। (2022) दिखाता है कि कैसे T2V को कई दृष्टिकोणों पर बढ़ाया जा सकता है। शोध एक नई ट्यून-ए-वीडियो पद्धति का प्रस्ताव करता है जो विषय और वस्तु परिवर्तन, शैली हस्तांतरण, विशेषता संपादन आदि जैसे T2V कार्यों का समर्थन करता है। यदि आप टेक्स्ट-टू-वीडियो शोध में रुचि रखते हैं तो यह पढ़ने के लिए एक बढ़िया पेपर है।

8) पायग्लोव: कुशलतापूर्वक एमएल विचारों को कोड के रूप में आदान-प्रदान करना

कुशल सहयोग किसी भी टीम की सफलता की कुंजी है, विशेष रूप से मशीन सीखने के क्षेत्र में बढ़ती जटिलता के साथ। दक्षता का पोषण करने के लिए, पेंग एट अल। (2023) ML विचारों को आसानी से साझा करने के लिए एक PyGlove लाइब्रेरी प्रस्तुत करें। PyGlove अवधारणा पैचिंग नियमों की सूची के माध्यम से ML अनुसंधान की प्रक्रिया को कैप्चर करना है। फिर सूची को किसी भी प्रयोग दृश्य में पुन: उपयोग किया जा सकता है, जिससे टीम की दक्षता में सुधार होता है। यह शोध है जो एक मशीन सीखने की समस्या को हल करने की कोशिश करता है जो अभी तक कई लोगों ने नहीं किया है, इसलिए यह पढ़ने लायक है।

8) चैटजीपीटी मानव विशेषज्ञों के कितने करीब है? तुलना कॉर्पस, मूल्यांकन और जांच

चैटजीपीटी ने दुनिया को बहुत बदल दिया है। यह कहना सुरक्षित है कि रुझान यहाँ से ऊपर की ओर जाएगा क्योंकि जनता पहले से ही ChatGPT का उपयोग करने के पक्ष में है। हालांकि, मानव विशेषज्ञों की तुलना में चैटजीपीटी का वर्तमान परिणाम कैसा है? यह बिल्कुल ऐसा सवाल है गुओ एट अल। (2023) उत्तर देने का प्रयास करें। टीम ने विशेषज्ञों और चैटजीपीटी शीघ्र परिणामों से डेटा एकत्र करने की कोशिश की, जिसकी उन्होंने तुलना की। परिणाम से पता चलता है कि चैटजीपीटी और विशेषज्ञों के बीच निहित अंतर थे। अनुसंधान कुछ ऐसा है जो मुझे लगता है कि भविष्य में पूछे जाते रहेंगे क्योंकि जनरेटिव एआई मॉडल समय के साथ बढ़ता रहेगा, इसलिए यह पढ़ने लायक है।

मशीन लर्निंग रिसर्च के लिए 2023 एक बेहतरीन साल है, जो मौजूदा चलन, खासकर चैटजीपीटी और स्टेबल डिफ्यूज़न जैसे जनरेटिव एआई द्वारा दिखाया गया है। बहुत आशाजनक शोध है जो मुझे लगता है कि हमें छोड़ना नहीं चाहिए क्योंकि यह आशाजनक परिणाम दिखाता है जो वर्तमान मानक को बदल सकता है। इस लेख में, मैंने आपको पढ़ने के लिए 9 शीर्ष एमएल पेपर दिखाए हैं, जिनमें जेनेरेटिव मॉडल, टाइम सीरीज़ मॉडल से लेकर वर्कफ़्लो दक्षता तक शामिल हैं। मुझे उम्मीद है यह मदद करेगा।
 
 
कार्नेलियस युधा विजया एक डेटा साइंस असिस्टेंट मैनेजर और डेटा राइटर है। एलियांज इंडोनेशिया में पूर्णकालिक काम करते हुए, उन्हें सोशल मीडिया और राइटिंग मीडिया के माध्यम से पायथन और डेटा टिप्स साझा करना पसंद है।
 

समय टिकट:

से अधिक केडनगेट्स