Suosituimmat koneoppimispaperit vuonna 2023

Julkaissut Platon

seuraajia: 0

Suosituimmat koneoppimispaperit vuonna 2023
Kuva pch.vektori on Freepik

Koneoppiminen on iso ala, ja uutta tutkimusta julkaistaan usein. Se on kuuma kenttä, jolla tiedemaailma ja teollisuus kokeilevat jatkuvasti uusia asioita parantaakseen jokapäiväistä elämäämme.

Viime vuosina generatiivinen tekoäly on muuttanut maailmaa koneoppimisen soveltamisen ansiosta. Esimerkiksi ChatGPT ja Stable Diffusion. Vaikka vuotta 2023 hallitsee generatiivinen tekoäly, meidän pitäisi olla tietoisia monista koneoppimisen läpimurroista.

Tässä ovat suosituimmat koneoppimispaperit, jotka voit lukea vuonna 2023, jotta et jää paitsi tulevista trendeistä.

1) Kappaleiden kauneuden oppiminen: Neural Singing Voice Beautifier

Singing Voice Beautifying (SVB) on uusi tehtävä generatiivisessa tekoälyssä, jonka tavoitteena on parantaa amatöörilauluääntä kauniiksi. Se on nimenomaan tutkimuksen tavoite Liu et ai. (2022) kun he ehdottivat uutta generatiivista mallia nimeltä Neural Singing Voice Beautifier (NSVB).

NSVB on puolivalvottu oppimismalli, joka käyttää piilevää kartoitusalgoritmia, joka toimii äänenkorkeuden korjaajana ja parantaa lauluääntä. Teos lupaa parantaa musiikkialaa ja on tutustumisen arvoinen.

2) Optimointialgoritmien symbolinen löytäminen

Syvähermoverkkomalleista on tullut suurempia kuin koskaan, ja koulutusprosessin yksinkertaistamiseksi on tehty paljon tutkimusta. Google-tiimin tuore tutkimus (Chen et ai. (2023)) on ehdottanut uutta optimointia neuroverkkoon nimeltä Lion (EvoLved Sign Momentum). Menetelmä osoittaa, että algoritmi on muistitehokkaampi ja vaatii pienemmän oppimisnopeuden kuin Adam. Se on hieno tutkimus, joka osoittaa monia lupauksia, joita sinun ei pidä jättää väliin.

3) TimesNet: ajallinen 2D-variaatiomallinnus yleistä aikasarja-analyysiä varten

Aikasarjaanalyysi on yleinen käyttötapa monissa yrityksissä; Esimerkiksi hintaennuste, poikkeamien havaitseminen jne. Ajankohtaisten tietojen analysointiin vain tämänhetkisen datan perusteella (1D-data) liittyy kuitenkin monia haasteita. Siksi Wu et ai. (2023) ehdottaa uutta menetelmää nimeltä TimesNet 1D-tietojen muuntamiseksi 2D-dataksi, mikä saavuttaa erinomaisen suorituskyvyn kokeessa. Sinun tulisi lukea paperi ymmärtääksesi paremmin tätä uutta menetelmää, koska se auttaisi paljon tulevaisuuden aikasarja-analyysiä.

4) OPT: Avaa valmiiksi koulutetut muuntajakielimallit

Tällä hetkellä elämme generatiivisen tekoälyn aikakautta, jossa yritykset ovat kehittäneet intensiivisesti monia suuria kielimalleja. Useimmiten tällainen tutkimus ei julkaise malliaan tai olisi vain kaupallisesti saatavilla. Kuitenkin Meta AI -tutkimusryhmä (Zhang et ai. (2022)) yrittää tehdä päinvastoin julkaisemalla julkisesti Open Pre-trained Transformers (OPT) -mallin, joka voisi olla verrattavissa GPT-3:een. Paperi on loistava alku OPT-mallin ja tutkimuksen yksityiskohtien ymmärtämiselle, sillä ryhmä kirjaa kaikki yksityiskohdat paperille.

5) REaLTabFormer: Realististen relaatio- ja taulukkotietojen luominen muuntajien avulla

Generatiivinen malli ei rajoitu vain tekstin tai kuvien tuottamiseen, vaan myös taulukkotietoihin. Tätä luotua dataa kutsutaan usein synteettiseksi dataksi. Monet mallit kehitettiin luomaan synteettistä taulukkotietoa, mutta lähes yhtäkään mallia relaatiotaulukkomuotoisen synteettisen datan luomiseksi. Tämä on nimenomaan tavoitteena Solatorio ja Dupriez (2023) tutkimus; luomalla mallin nimeltä REaLTabFormer synteettiselle relaatiodatalle. Kokeilu on osoittanut, että tulos on tarkasti lähellä olemassa olevaa synteettistä mallia, jota voitaisiin laajentaa moniin sovelluksiin.

6) Onko vahvistava oppiminen (ei) luonnollisen kielen käsittelyyn?: Vertailuarvot, lähtökohdat ja rakennuspalikoita luonnollisen kielen politiikan optimointiin

Vahvistusoppiminen käsitteellisesti on erinomainen valinta luonnollisen kielenkäsittelytehtävään, mutta onko se totta? Tämä on kysymys siitä Ramamurthy et ai. (2022) yritä vastata. Tutkija esittelee erilaisia kirjastoja ja algoritmeja, jotka osoittavat, missä vahvistusoppimistekniikoilla on etua NLP-tehtävissä ohjattuun menetelmään verrattuna. Se on suositeltavaa lukea, jos haluat vaihtoehdon osaamisellesi.

7) Tune-A-Video: Kuvahajotusmallien viritys yhdellä otolla tekstistä videoksi luomista varten

Tekstistä kuvaksi -tuotanto oli suuri vuonna 2022, ja vuonna 2023 ennustettaisiin tekstistä videoksi (T2V) -ominaisuutta. Tutkimus Wu et ai. (2022) osoittaa, kuinka T2V:tä voidaan laajentaa moniin lähestymistapoihin. Tutkimus ehdottaa uutta Tune-a-Video -menetelmää, joka tukee T2V-tehtäviä, kuten subjektin ja objektin vaihtamista, tyylin siirtoa, attribuuttien muokkausta jne. Se on hyvä artikkeli luettavaksi, jos olet kiinnostunut tekstistä videoksi -tutkimuksesta.

8) PyGlove: ML-ideoiden tehokas vaihtaminen koodina

Tehokas yhteistyö on avain menestykseen missä tahansa tiimissä, erityisesti koneoppimisen monimutkaisuuden lisääntyessä. Tehokkuuden kasvattamiseksi, Peng et ai. (2023) esittele PyGlove-kirjasto ML-ideoiden jakamiseksi helposti. PyGlove-konsepti on kaapata ML-tutkimuksen prosessi korjaussääntöjen luettelon avulla. Listaa voidaan sitten käyttää uudelleen missä tahansa kokeilutilanteessa, mikä parantaa joukkueen tehokkuutta. Se on tutkimus, joka yrittää ratkaista koneoppimisongelman, jota monet eivät ole vielä tehneet, joten se kannattaa lukea.

8) Kuinka lähellä ChatGPT on ihmisasiantuntijoita? Vertailukorpus, arviointi ja havaitseminen

ChatGPT on muuttanut maailmaa niin paljon. On turvallista sanoa, että trendi nousisi tästä eteenpäin, koska yleisö kannattaa jo ChatGPT:n käyttöä. Miten ChatGPT:n nykyinen tulos on verrattuna Human Expertsiin? Se on juuri sellainen kysymys Guo et ai. (2023) yritä vastata. Tiimi yritti kerätä tietoja asiantuntijoilta ja ChatGPT-pikatuloksia, joita he vertasivat. Tulos osoittaa, että ChatGPT:n ja asiantuntijoiden välillä oli implisiittisiä eroja. Tutkimus on jotain, jota minusta kysytään jatkossakin, koska generatiivinen tekoälymalli kasvaa ajan myötä, joten se kannattaa lukea.

2023 on loistava vuosi koneoppimisen tutkimukselle, joka näkyy nykytrendissä, erityisesti generatiivisessa tekoälyssä, kuten ChatGPT ja Stable Diffusion. On olemassa paljon lupaavia tutkimuksia, joita meidän ei mielestäni pidä jättää väliin, koska se on osoittanut lupaavia tuloksia, jotka saattavat muuttaa nykyistä standardia. Tässä artikkelissa olen näyttänyt sinulle 9 suosituinta ML-paperia luettavaksi, aina generatiivisesta mallista, aikasarjamallista työnkulun tehokkuuteen. Toivottavasti se auttaa.

Cornelius Yudha Wijaya on datatieteen apulaisjohtaja ja tietojen kirjoittaja. Työskennellessään kokopäiväisesti Allianz Indonesiassa hän mielellään jakaa Python- ja Data-vinkkejä sosiaalisen median ja kirjoitusmedian kautta.