Top Machine Learning Papers To Read In 2023

Újra kiadta Platón

Követő: 0

A legjobb gépi tanulási dokumentumok 2023-ban
Kép pch.vector on Freepik

A gépi tanulás nagy terület, ahol gyakran jelennek meg új kutatások. Ez egy forró terep, ahol az akadémia és az ipar folyamatosan új dolgokkal kísérletezik mindennapi életünk javítása érdekében.

Az elmúlt években a generatív AI megváltoztatta a világot a gépi tanulás alkalmazása miatt. Például a ChatGPT és a Stable Diffusion. Még akkor is, ha 2023-at a generatív mesterséges intelligencia uralja, még sok más gépi tanulási áttörésről kell tudnunk.

Íme a legjobb gépi tanulási cikkek, amelyeket 2023-ban érdemes elolvasni, hogy ne maradjon le a közelgő trendekről.

1) A szépség megtanulása a dalokban: Neurális énekhangszépítő

A Singing Voice Beautifying (SVB) egy újszerű feladat a generatív mesterséges intelligenciában, amelynek célja az amatőr énekhang gyönyörűvé fejlesztése. Pontosan ez a kutatási cél Liu et al. (2022) amikor egy új generatív modellt javasoltak Neural Singing Voice Beautifier (NSVB) néven.

Az NSVB egy félig felügyelt tanulási modell, amely látens leképezési algoritmust használ, amely hangmagasság-korrekcióként működik, és javítja az énekhangot. A mű a zenei ipar fejlesztését ígéri, érdemes megnézni.

2) Az optimalizálási algoritmusok szimbolikus felfedezése

A mély neurális hálózatok modelljei nagyobbak lettek, mint valaha, és sok kutatást végeztek a képzési folyamat egyszerűsítésére. A Google csapatának legújabb kutatása (Chen et al. (2023)) új optimalizálást javasolt a Lion (EvoLved Sign Momentum) nevű neurális hálózathoz. A módszer azt mutatja, hogy az algoritmus memóriahatékonyabb, és kisebb tanulási sebességet igényel, mint Ádám. Ez egy nagyszerű kutatás, amely sok ígéretet mutat, amelyeket nem szabad kihagynia.

3) TimesNet: Időbeli 2D-változatmodellezés általános idősorelemzéshez

Az idősorok elemzése sok vállalkozásnál gyakori használat; Például ár-előrejelzés, anomáliák észlelése stb. Azonban számos kihívást jelent az időbeli adatok csak a jelenlegi adatok (1D adatok) alapján történő elemzése. Ezért Wu és mtsai. (2023) egy új TimesNet nevű módszert javasolnak az 1D adatok 2D adatokká történő átalakítására, ami nagyszerű teljesítményt ér el a kísérletben. Olvassa el a cikket, hogy jobban megértse ezt az új módszert, mivel ez sokat segítene a jövőbeni idősorok elemzésében.

4) OPT: Nyissa meg az előre betanított transzformátor nyelvi modelleket

Jelenleg a generatív mesterséges intelligencia korszakát éljük, amikor számos nagy nyelvi modellt intenzíven fejlesztettek a vállalatok. Az ilyen jellegű kutatások többnyire nem adnák ki modelljüket, vagy csak kereskedelmi forgalomban kaphatók. A Meta AI kutatócsoport azonban (Zhang és munkatársai. (2022)) ennek az ellenkezőjét próbálja elérni azáltal, hogy nyilvánosan kiadja az Open Pre-trained Transformers (OPT) modellt, amely összevethető a GPT-3-mal. A cikk remek kezdet az OPT-modell és a kutatás részleteinek megértéséhez, mivel a csoport minden részletet naplóz a dolgozatban.

5) REaLTabFormer: Reális relációs és táblázatos adatok generálása transzformátorok segítségével

A generatív modell nemcsak szöveg vagy képek generálására korlátozódik, hanem táblázatos adatokra is. Ezeket a generált adatokat gyakran szintetikus adatoknak nevezik. Sok modellt fejlesztettek ki szintetikus táblázatos adatok előállítására, de szinte egyetlen modellt sem relációs táblázatos szintetikus adatok előállítására. Pontosan ez a célja Solatorio és Dupriez (2023) kutatás; REaLTabFormer nevű modell létrehozása szintetikus relációs adatokhoz. A kísérlet kimutatta, hogy az eredmény pontosan közel áll a meglévő szintetikus modellhez, amely számos alkalmazásra kiterjeszthető.

6) Megerősítő tanulás (nem) a természetes nyelvi feldolgozáshoz?: A természetes nyelvi politika optimalizálásának referenciaértékei, alapjai és építőkövei

Megerősítés A fogalmi tanulás kiváló választás a természetes nyelvi feldolgozási feladathoz, de igaz? Ez egy olyan kérdés Ramamurthy et al. (2022) próbálj válaszolni. A kutató különféle könyvtárakat és algoritmusokat mutat be, amelyek megmutatják, hogy az erősítő tanulási technikák hol vannak előnyben a felügyelt módszerrel szemben az NLP feladatokban. Javasoljuk, hogy elolvassa, ha alternatívát szeretne a képességeihez.

7) Tune-A-Video: A képszórási modellek egyszeri hangolása a szöveg-videó generálásához

2022-ben nagy volt a szövegből képbe átalakítás, 2023-ban pedig a szöveg-videó (T2V) képességet vetítik előre. Kutatása Wu és mtsai. (2022) bemutatja, hogy a T2V hogyan bővíthető számos megközelítésben. A kutatás egy új Tune-a-Video módszert javasol, amely támogatja a T2V-feladatokat, például alany- és objektumváltást, stílusátvitelt, attribútumok szerkesztését stb. Remek tanulmány, ha érdeklődik a szöveg-videó kutatás iránt.

8) PyGlove: Az ML ötletek hatékony cseréje kódként

A hatékony együttműködés a siker kulcsa bármely csapatnál, különösen a gépi tanulási területek egyre bonyolultabbá válása mellett. A hatékonyság növelése érdekében, Peng és mtsai. (2023) bemutat egy PyGlove könyvtárat az ML ötletek egyszerű megosztásához. A PyGlove koncepciója az ML-kutatás folyamatának rögzítése a javítási szabályok listáján keresztül. A lista ezután bármely kísérleti jelenetben újra felhasználható, ami javítja a csapat hatékonyságát. Ez egy olyan kutatás, amely egy olyan gépi tanulási problémát próbál megoldani, amelyet sokan még nem csináltak, ezért érdemes elolvasni.

8) Mennyire áll közel a ChatGPT a humán szakértőkhöz? Összehasonlító korpusz, értékelés és észlelés

A ChatGPT nagyon megváltoztatta a világot. Nyugodtan kijelenthető, hogy a trend innentől felfelé ível, mivel a közvélemény már most a ChatGPT használata mellett áll. Azonban hogyan áll a ChatGPT jelenlegi eredménye a Human Expertshez képest? Pontosan ez a kérdés Guo et al. (2023) próbálj válaszolni. A csapat megpróbált adatokat gyűjteni szakértőktől és ChatGPT azonnali eredményeket, amelyeket összehasonlítottak. Az eredmény azt mutatja, hogy a ChatGPT és a szakértők között implicit különbségek voltak. A kutatásról úgy érzem, hogy a jövőben is fel fognak kérdezni, mivel a generatív AI-modell idővel folyamatosan bővülni fog, ezért érdemes elolvasni.

2023 kiváló év a gépi tanulási kutatások számára, amelyeket a jelenlegi trend mutat, különösen az olyan generatív mesterséges intelligencia, mint a ChatGPT és a Stable Diffusion. Sok ígéretes kutatás van, amelyet szerintem nem szabad kihagynunk, mert olyan ígéretes eredményeket mutattak fel, amelyek megváltoztathatják a jelenlegi szabványt. Ebben a cikkben 9 legnépszerűbb ML-dokumentumot mutattam be, a generatív modelltől az idősor-modelltől a munkafolyamat-hatékonyságig. Remélem segít.

Cornelius Yudha Wijaya adattudományi asszisztens menedzser és adatíró. Miközben teljes munkaidőben dolgozik az Allianz Indonesia-nál, szeret Python és Data tippeket megosztani a közösségi médián és az írási médián keresztül.