ניירות למידת מכונה מובילים לקריאה בשנת 2023

ניירות למידת מכונה מובילים לקריאה בשנת 2023

צומת המקור: 2016455

ניירות למידת מכונה מובילים לקריאה בשנת 2023
תמונה על ידי pc.vector on פריפיק
 

למידת מכונה היא תחום גדול עם מחקרים חדשים שיוצאים לעתים קרובות. זהו תחום לוהט שבו האקדמיה והתעשייה ממשיכות להתנסות בדברים חדשים כדי לשפר את חיי היומיום שלנו.

בשנים האחרונות, AI גנרטיבי משנה את העולם עקב היישום של למידת מכונה. לדוגמה, ChatGPT ו-Stable Diffusion. אפילו כששנת 2023 נשלטת על ידי AI גנרטיבי, עלינו להיות מודעים להרבה יותר פריצות דרך של למידת מכונה.

להלן מאמרי לימוד המכונה המובילים לקריאה בשנת 2023 כדי שלא תפספסו את המגמות הקרובות.

1) לימוד היופי בשירים: מייפה קול שירה עצבית

יפיוף קול שירה (SVB) היא משימה חדשה ב-AI גנרטיבי שמטרתה לשפר את קול השירה החובב לקול יפהפה. זו בדיוק מטרת המחקר Liu et al. (2022) כשהציעו מודל יצירתי חדש בשם Neural Singing Voice Beautifier (NSVB). 

ה-NSVB הוא מודל למידה מפוקח למחצה באמצעות אלגוריתם מיפוי סמוי הפועל כמתקן גובה הצליל ומשפר את הטון הקולי. העבודה מבטיחה לשפר את התעשייה המוזיקלית ושווה בדיקה.

2) גילוי סמלי של אלגוריתמי אופטימיזציה

מודלים של רשתות עצביות עמוקות הפכו גדולים מתמיד, ומחקר רב נערך כדי לפשט את תהליך האימון. מחקר אחרון של צוות גוגל (חן וחב'. (2023)) הציע אופטימיזציה חדשה עבור הרשת העצבית בשם Lion (EvoLved Sign Momentum). השיטה מראה שהאלגוריתם יעיל יותר בזיכרון ודורש קצב למידה קטן יותר מאדם. זה מחקר נהדר שמראה הבטחות רבות שאסור לך לפספס.

3) TimesNet: מודלים זמניים של 2D-variation עבור ניתוח סדרות זמן כללי

ניתוח סדרות זמן הוא מקרה שימוש נפוץ בעסקים רבים; לדוגמה, חיזוי מחירים, זיהוי חריגות וכו'. עם זאת, ישנם אתגרים רבים בניתוח נתונים זמניים רק על סמך הנתונים הנוכחיים (נתוני 1D). זו הסיבה וו וחב'. (2023) להציע שיטה חדשה בשם TimesNet להפיכת נתוני 1D לנתונים 2D, המשיגה ביצועים מעולים בניסוי. כדאי לקרוא את המאמר כדי להבין טוב יותר את השיטה החדשה הזו מכיוון שהיא תעזור הרבה לניתוח סדרות זמן עתידיות.

4) OPT: פתח מודלים שפות שנאיים מאומנים מראש

נכון לעכשיו, אנו נמצאים בעידן AI יצירתי שבו מודלים רבים של שפות גדולות פותחו באינטנסיביות על ידי חברות. לרוב סוג זה של מחקר לא ישחרר את הדגם שלהם או יהיה זמין רק מסחרית. עם זאת, קבוצת המחקר Meta AI (ג'אנג ואחרים. (2022)) מנסה לעשות את ההיפך על ידי שחרור פומבי של הדגם Open Pre-trained Transformers (OPT) שיכול להיות דומה ל-GPT-3. המאמר הוא התחלה מצוינת להבנת מודל ה-OPT ופרט המחקר, שכן הקבוצה רושם את כל הפרטים במאמר.

5) REaLTabFormer: הפקת נתונים יחסיים וטבלאריים מציאותיים באמצעות רובוטריקים

המודל הגנרטיבי אינו מוגבל רק להפקת טקסט או תמונות אלא גם נתונים טבלאיים. נתונים שנוצרו נקראים לעתים קרובות נתונים סינתטיים. מודלים רבים פותחו להפקת נתונים טבלאיים סינתטיים, אך כמעט אף מודל ליצירת נתונים סינטטי טבלאי יחסי. זו בדיוק המטרה של סולטוריו ודופרייז (2023) מחקר; יצירת מודל בשם REaLTabFormer לנתונים יחסיים סינתטיים. הניסוי הראה שהתוצאה קרובה במדויק למודל הסינטטי הקיים, שניתן להרחיב אותו ליישומים רבים.

6) האם למידת חיזוק (לא) לעיבוד שפה טבעית?: אמות מידה, קווי בסיס ואבני בניין לייעול מדיניות שפה טבעית

חיזוק למידה מושגית היא בחירה מצוינת עבור משימת עיבוד השפה הטבעית, אבל האם זה נכון? זו שאלה ש Ramamurthy et al. (2022) לנסות לענות. החוקר מציג ספריות שונות ואלגוריתמים המראים היכן יש יתרון לטכניקות למידת חיזוק בהשוואה לשיטה המפוקחת במשימות ה-NLP. זה מאמר מומלץ לקרוא אם אתה רוצה אלטרנטיבה למערך הכישורים שלך.

7) Tune-A-Video: כוונון בצילום אחד של דגמי פיזור תמונה ליצירת טקסט לווידאו

יצירת טקסט לתמונה הייתה גדולה ב-2022, ושנת 2023 תוקרן עם יכולת טקסט לווידאו (T2V). מחקר מאת וו וחב'. (2022) מראה כיצד ניתן להרחיב את T2V בגישות רבות. המחקר מציע שיטת Tune-a-Video חדשה התומכת במשימות T2V כגון שינוי נושא ואובייקט, העברת סגנון, עריכת תכונות וכו'. זה מאמר נהדר לקרוא אם אתה מעוניין במחקר טקסט לווידאו.

8) PyGlove: החלפה יעילה של רעיונות ML כקוד

שיתוף פעולה יעיל הוא המפתח להצלחה בכל צוות, במיוחד עם המורכבות הגוברת בתחומי למידת מכונה. כדי לטפח יעילות, פנג וחב'. (2023) הצג ספריית PyGlove כדי לשתף רעיונות ML בקלות. הרעיון של PyGlove הוא ללכוד את התהליך של מחקר ML באמצעות רשימה של כללי תיקון. לאחר מכן ניתן לעשות שימוש חוזר ברשימה בכל סצנת ניסויים, מה שמשפר את היעילות של הצוות. זה מחקר שמנסה לפתור בעיית למידת מכונה שרבים לא עשו עדיין, אז כדאי לקרוא.

8) כמה קרובה ChatGPT למומחים אנושיים? קורפוס השוואה, הערכה ואיתור

ChatGPT כל כך שינה את העולם. זה בטוח לומר שהמגמה תעלה מכאן מכיוון שהציבור כבר בעד השימוש ב-ChatGPT. עם זאת, איך התוצאה הנוכחית של ChatGPT בהשוואה למומחים האנושיים? זו בדיוק שאלה ש Guo et al. (2023) לנסות לענות. הצוות ניסה לאסוף נתונים ממומחים ותוצאות הודעות ChatGPT, שאותן השוו. התוצאה מראה שהיו הבדלים מרומזים בין ChatGPT למומחים. המחקר הוא משהו שלדעתי יישאל בעתיד מכיוון שמודל ה-AI הגנרטיבי ימשיך לגדול עם הזמן, אז כדאי לקרוא.

2023 היא שנה מצוינת למחקר למידת מכונה שמוצגת על ידי המגמה הנוכחית, במיוחד בינה מלאכותית גנרטיבית כמו ChatGPT ו-Stable Diffusion. יש הרבה מחקרים מבטיחים שאני מרגיש שאסור לנו להחמיץ כי הוא הראה תוצאות מבטיחות שעשויות לשנות את הסטנדרט הנוכחי. במאמר זה, הראיתי לך 9 מאמרים מובילים ב-ML לקריאה, החל מהמודל הגנרטיבי, מודל סדרת זמן ועד ליעילות זרימת העבודה. אני מקווה שזה עוזר.
 
 
קורנליוס יודא וויאיה הוא עוזר מנהל וכותב נתונים במדעי הנתונים. בעודו עובד במשרה מלאה באליאנץ אינדונזיה, הוא אוהב לחלוק טיפים לפייתון ונתונים באמצעות מדיה חברתית ומדיה כתיבה.
 

בול זמן:

עוד מ KDnuggets