برترین مقالات یادگیری ماشین برای خواندن در سال 2023

برترین مقالات یادگیری ماشین برای خواندن در سال 2023

گره منبع: 2016455

برترین مقالات یادگیری ماشین برای خواندن در سال 2023
تصویر pch.vector on Freepik
 

یادگیری ماشینی یک زمینه بزرگ است که تحقیقات جدیدی به طور مکرر انجام می شود. این یک حوزه داغ است که در آن دانشگاه و صنعت به آزمایش چیزهای جدید برای بهبود زندگی روزمره ما ادامه می دهند.

در سال های اخیر، هوش مصنوعی مولد به دلیل استفاده از یادگیری ماشینی، دنیا را تغییر داده است. برای مثال ChatGPT و Stable Diffusion. حتی با وجود اینکه سال 2023 تحت سلطه هوش مصنوعی مولد است، ما باید از پیشرفت های یادگیری ماشینی بیشتری آگاه باشیم.

در اینجا برترین مقالات یادگیری ماشینی برای خواندن در سال 2023 آورده شده است تا روندهای آینده را از دست ندهید.

1) یادگیری زیبایی در آهنگ ها: زیباساز صدای آواز عصبی

Singing Voice Beautifying (SVB) یک کار جدید در هوش مصنوعی مولد است که هدف آن بهبود صدای آواز آماتور به یک صدای زیبا است. این دقیقاً هدف تحقیق است لی و همکاران (2022) زمانی که آنها یک مدل مولد جدید به نام Neural Singing Voice Beautifier (NSVB) را پیشنهاد کردند. 

NSVB یک مدل یادگیری نیمه نظارت شده با استفاده از یک الگوریتم نگاشت پنهان است که به عنوان یک تصحیح کننده زیر و بم عمل می کند و آهنگ صدا را بهبود می بخشد. این اثر نوید بهبود صنعت موسیقی را می دهد و ارزش بررسی را دارد.

2) کشف نمادین الگوریتم های بهینه سازی

مدل‌های شبکه عصبی عمیق بزرگ‌تر از همیشه شده‌اند و تحقیقات زیادی برای ساده‌سازی فرآیند آموزش انجام شده است. تحقیقات اخیر توسط تیم گوگل (چن و همکاران (2023)) بهینه سازی جدیدی برای شبکه عصبی به نام Lion (EvoLved Sign Momentum) پیشنهاد کرده است. این روش نشان می دهد که الگوریتم حافظه کارآمدتر است و به نرخ یادگیری کمتری نسبت به Adam نیاز دارد. این تحقیقات عالی است که وعده های زیادی را نشان می دهد که نباید از دست بدهید.

3) TimesNet: مدل‌سازی تغییرات دوبعدی زمانی برای تجزیه و تحلیل سری‌های زمانی عمومی

تجزیه و تحلیل سری های زمانی یک مورد رایج در بسیاری از مشاغل است. به عنوان مثال، پیش بینی قیمت، تشخیص ناهنجاری، و غیره. با این حال، چالش های زیادی برای تجزیه و تحلیل داده های زمانی تنها بر اساس داده های فعلی (داده های 1D) وجود دارد. به همین دلیل است وو و همکاران (2023) روش جدیدی به نام TimesNet برای تبدیل داده‌های 1 بعدی به داده‌های دوبعدی پیشنهاد می‌کند که عملکرد عالی در آزمایش به دست می‌آورد. شما باید مقاله را بخوانید تا این روش جدید را بهتر درک کنید زیرا به تجزیه و تحلیل سری های زمانی آینده کمک می کند.

4) OPT: مدل های زبان ترانسفورماتور از قبل آموزش دیده را باز کنید

در حال حاضر، ما در یک دوره هوش مصنوعی مولد هستیم که در آن بسیاری از مدل‌های زبان بزرگ به شدت توسط شرکت‌ها توسعه داده شده‌اند. عمدتاً این نوع تحقیقات مدل خود را منتشر نمی کند یا فقط به صورت تجاری در دسترس است. با این حال، گروه تحقیقاتی Meta AI (ژانگ و همکاران (2022)) با انتشار عمومی مدل Open Pre-trained Transformers (OPT) که می تواند با GPT-3 قابل مقایسه باشد، برعکس عمل کند. این مقاله یک شروع عالی برای درک مدل OPT و جزئیات تحقیق است، زیرا گروه تمام جزئیات را در مقاله ثبت می کند.

5) REaLTabFormer: تولید داده های رابطه ای و جدولی واقعی با استفاده از ترانسفورماتورها

مدل تولیدی تنها به تولید متن یا عکس محدود نمی شود، بلکه داده های جدولی را نیز تولید می کند. این داده های تولید شده اغلب داده های مصنوعی نامیده می شوند. مدل‌های زیادی برای تولید داده‌های جدولی مصنوعی توسعه داده شدند، اما تقریباً هیچ مدلی برای تولید داده‌های مصنوعی جدولی رابطه‌ای ایجاد نشد. این دقیقاً هدف است Solatorio and Dupriez (2023) پژوهش؛ ایجاد مدلی به نام REaLTabFormer برای داده های رابطه ای مصنوعی. این آزمایش نشان داده است که نتیجه به طور دقیق به مدل مصنوعی موجود نزدیک است، که می تواند به بسیاری از برنامه ها گسترش یابد.

6) آیا یادگیری تقویتی (نه) برای پردازش زبان طبیعی است؟

Reinforcement Learning از نظر مفهومی یک انتخاب عالی برای کار پردازش زبان طبیعی است، اما آیا درست است؟ این سوالی است که رامورتی و همکاران (2022) سعی کن جواب بدی محقق کتابخانه ها و الگوریتم های مختلفی را معرفی می کند که نشان می دهد تکنیک های یادگیری تقویتی در مقایسه با روش نظارت شده در وظایف NLP در کجا برتری دارند. اگر می‌خواهید جایگزینی برای مجموعه مهارت‌های خود داشته باشید، توصیه می‌شود این مقاله را بخوانید.

7) Tune-A-Video: تنظیم یک شات مدل های انتشار تصویر برای تولید متن به ویدئو

تولید متن به تصویر در سال 2022 بزرگ بود و سال 2023 با قابلیت متن به تصویر (T2V) پیش بینی می شود. تحقیق توسط وو و همکاران (2022) نشان می دهد که چگونه T2V را می توان در بسیاری از رویکردها گسترش داد. این تحقیق یک روش جدید Tune-a-Video را پیشنهاد می‌کند که از کارهای T2V مانند تغییر موضوع و شی، انتقال سبک، ویرایش ویژگی‌ها و غیره پشتیبانی می‌کند. اگر علاقه‌مند به تحقیق متن به ویدئو هستید، این مقاله عالی برای خواندن است.

8) PyGlove: تبادل کارآمد ایده های ML به عنوان کد

همکاری کارآمد کلید موفقیت در هر تیمی است، به خصوص با افزایش پیچیدگی در زمینه های یادگیری ماشین. برای پرورش کارایی، پنگ و همکاران (2023) یک کتابخانه PyGlove ارائه دهید تا ایده های ML را به راحتی به اشتراک بگذارید. مفهوم PyGlove این است که فرآیند تحقیق ML را از طریق فهرستی از قوانین وصله‌سازی ثبت کند. سپس می توان از این لیست در هر صحنه آزمایشی استفاده مجدد کرد که کارایی تیم را بهبود می بخشد. این تحقیقی است که سعی می کند مشکل یادگیری ماشینی را حل کند که بسیاری هنوز انجام نداده اند، بنابراین خواندن آن خالی از لطف نیست.

8) ChatGPT چقدر به متخصصان انسانی نزدیک است؟ مجموعه مقایسه، ارزیابی و تشخیص

ChatGPT دنیا را بسیار تغییر داده است. به جرات می توان گفت که این روند از اینجا به سمت بالا خواهد رفت زیرا عموم مردم از قبل طرفدار استفاده از ChatGPT هستند. با این حال، نتیجه فعلی ChatGPT در مقایسه با Human Experts چگونه است؟ این دقیقا یک سوال است که Guo و همکاران (2023) سعی کن جواب بدی این تیم سعی کرد داده‌ها را از کارشناسان جمع‌آوری کند و نتایج سریع ChatGPT را با هم مقایسه کند. نتیجه نشان می دهد که تفاوت های ضمنی بین ChatGPT و کارشناسان وجود دارد. این تحقیق چیزی است که فکر می‌کنم در آینده از آن سؤال می‌شود، زیرا مدل هوش مصنوعی مولد در طول زمان همچنان در حال رشد است، بنابراین خواندن آن ارزش دارد.

2023 سال خوبی برای تحقیقات یادگیری ماشینی است که با روند فعلی نشان داده شده است، به ویژه هوش مصنوعی مولد مانند ChatGPT و Stable Diffusion. تحقیقات امیدوارکننده زیادی وجود دارد که فکر می‌کنم نباید از دست بدهیم زیرا نتایج امیدوارکننده‌ای نشان داده‌اند که ممکن است استاندارد فعلی را تغییر دهد. در این مقاله، من 9 مقاله برتر ML را برای خواندن به شما نشان دادم، از مدل تولیدی، مدل سری زمانی تا کارایی گردش کار. امیدوارم کمک کند.
 
 
کورنلیوس یودا ویجایا دستیار مدیر علوم داده و نویسنده داده است. در حالی که به طور تمام وقت در آلیانز اندونزی کار می کند، دوست دارد نکات Python و Data را از طریق رسانه های اجتماعی و رسانه های نوشتاری به اشتراک بگذارد.
 

تمبر زمان:

بیشتر از kdnuggets