Populaarseimad masinõppe dokumendid, mida 2023. aastal lugeda

Taasavaldanud Platon

järgijaid: 0

Populaarseimad masinõppe dokumendid, mida lugeda 2023. aastal
Image by pc.vektor on Freepik

Masinõpe on suur valdkond, kus ilmub sageli uusi uuringuid. See on kuum valdkond, kus akadeemilised ringkonnad ja tööstus katsetavad pidevalt uusi asju, et parandada meie igapäevast elu.

Viimastel aastatel on generatiivne AI muutnud maailma tänu masinõppe rakendamisele. Näiteks ChatGPT ja Stable Diffusion. Isegi kui 2023. aastal domineerib generatiivne tehisintellekt, peaksime olema teadlikud veel paljudest masinõppe läbimurdest.

Siin on parimad masinõppe dokumendid, mida 2023. aastal lugeda, et te ei jääks tulevastest trendidest ilma.

1) Laulude ilu õppimine: Neural Singing Voice Beautifier

Singing Voice Beautifying (SVB) on generatiivse AI uudne ülesanne, mille eesmärk on muuta amatööride lauluhääl kauniks. See on täpselt uurimistöö eesmärk Liu jt. (2022) kui nad pakkusid välja uue generatiivse mudeli nimega Neural Singing Voice Beautifier (NSVB).

NSVB on pooleldi järelevalvega õppemudel, mis kasutab varjatud kaardistamise algoritmi, mis toimib helikõrguse korrektorina ja parandab hääletooni. Teos tõotab parandada muusikatööstust ja tasub üle vaadata.

2) Optimeerimisalgoritmide sümboolne avastamine

Sügavate närvivõrkude mudelid on muutunud suuremaks kui kunagi varem ja koolitusprotsessi lihtsustamiseks on tehtud palju uuringuid. Google'i meeskonna hiljutine uuring (Chen et al. (2023)) on pakkunud välja uue optimeerimise närvivõrgule nimega Lion (EvoLved Sign Momentum). Meetod näitab, et algoritm on mälutõhusam ja nõuab väiksemat õppimiskiirust kui Adam. See on suurepärane uuring, mis näitab palju lubadusi, mida ei tohiks unustada.

3) TimesNet: ajaline 2D-variatsiooni modelleerimine üldiseks aegridade analüüsiks

Aegridade analüüs on paljudes ettevõtetes tavaline kasutusjuht; Näiteks hindade prognoosimine, anomaaliate tuvastamine jne. Kuid ajaliste andmete analüüsimine ainult praeguste andmete (1D andmete) põhjal on palju väljakutseid. Sellepärast Wu et al. (2023) pakub välja uue meetodi nimega TimesNet, et muuta 1D-andmed 2D-andmeteks, mis saavutab katses suurepärase jõudluse. Peaksite paberit lugema, et seda uut meetodit paremini mõista, kuna see aitaks palju tulevikus aegridade analüüsimisel.

4) OPT: avage eelkoolitatud transformaatori keelemudelid

Praegu oleme generatiivses AI ajastus, kus ettevõtted arendasid intensiivselt palju suuri keelemudeleid. Enamasti ei avaldaks sellised uuringud nende mudelit või on need ainult kaubanduslikult saadaval. Kuid Meta AI uurimisrühm (Zhang jt. (2022)) üritab teha vastupidist, avaldades avalikult avatud eelkoolitatud transformaatorite (OPT) mudeli, mis võiks olla võrreldav GPT-3-ga. See artikkel on suurepärane algus OPT-mudeli ja uurimistöö üksikasjade mõistmiseks, kuna rühm logib kõik üksikasjad paberile.

5) REaLTabFormer: realistlike relatsiooni- ja tabeliandmete genereerimine transformerite abil

Generatiivne mudel ei piirdu ainult teksti või piltide genereerimisega, vaid ka tabeliandmetega. Neid genereeritud andmeid nimetatakse sageli sünteetilisteks andmeteks. Paljud mudelid töötati välja sünteetiliste tabeliandmete genereerimiseks, kuid peaaegu mitte ühtegi mudelit relatsioonitabeli sünteetiliste andmete genereerimiseks. See on täpselt eesmärk Solatorio ja Dupriez (2023) uuringud; luua mudel nimega REaLTabFormer sünteetiliste relatsiooniandmete jaoks. Katse on näidanud, et tulemus on täpselt lähedane olemasolevale sünteetilisele mudelile, mida saaks laiendada paljudele rakendustele.

6) Kas tugevdav õpe (mitte) loomuliku keele töötlemiseks?: Loomuliku keele poliitika optimeerimise võrdlusalused, lähtealused ja ehituskivid

Kontseptuaalne tugevdamine on suurepärane valik loomuliku keele töötlemise ülesande jaoks, kuid kas see on tõsi? See on küsimus, et Ramamurthy jt. (2022) proovi vastata. Teadlane tutvustab erinevaid raamatukogusid ja algoritme, mis näitavad, kus on tugevdamisõppe tehnikatel NLP ülesannete juhendatava meetodiga võrreldes eelis. See on soovitatav paber lugeda, kui soovite oma oskuste jaoks alternatiivi.

7) Tune-A-Video: ühe võttega pildi hajutamismudelite häälestamine tekstist videoks genereerimiseks

Tekstist pildiks genereerimine oli 2022. aastal suur ja 2023. aastal prognoositakse teksti videoks (T2V) võimekust. Uurimistöö autor Wu et al. (2022) näitab, kuidas T2V-d saab mitmel viisil laiendada. Uurimistöö pakub välja uut Tune-a-Video meetodit, mis toetab T2V ülesandeid, nagu subjekti ja objekti muutmine, stiilide ülekandmine, atribuutide redigeerimine jne. See on suurepärane paber lugemiseks, kui olete huvitatud tekstist videoks muutmise uurimisest.

8) PyGlove: ML-ideede tõhus vahetamine koodina

Tõhus koostöö on iga meeskonna edu võti, eriti kui masinõppe valdkonnad muutuvad keerukamaks. Tõhususe kasvatamiseks, Peng jt. (2023) esitlege PyGlove'i raamatukogu, et ML-ideid hõlpsalt jagada. PyGlove'i kontseptsioon on ML-i uurimise protsessi jäädvustamine paikamisreeglite loendi kaudu. Seejärel saab loendit uuesti kasutada mis tahes katsestseenis, mis parandab meeskonna tõhusust. See on uurimus, mis püüab lahendada masinõppeprobleemi, mida paljud pole veel teinud, seega tasub seda lugeda.

8) Kui lähedal on ChatGPT inimekspertidele? Võrdluskorpus, hindamine ja tuvastamine

ChatGPT on maailma nii palju muutnud. Võib kindlalt öelda, et suundumus tõuseb siit, kuna avalikkus pooldab juba ChatGPT kasutamist. Kuidas on aga ChatGPT praegune tulemus võrreldes inimekspertidega? See on täpselt selline küsimus Guo et al. (2023) proovi vastata. Meeskond püüdis koguda ekspertidelt andmeid ja ChatGPT kiireid tulemusi, mida nad võrdlesid. Tulemus näitab, et ChatGPT ja ekspertide vahel olid kaudsed erinevused. Uuring on midagi, mida minu arvates küsitakse ka tulevikus, kuna generatiivne AI mudel aja jooksul kasvab, seega tasub seda lugeda.

2023. aasta on suurepärane aasta masinõppe uurimiseks, mida näitab praegune suundumus, eriti generatiivne AI, nagu ChatGPT ja Stable Diffusion. On palju paljutõotavaid uuringuid, mida ma arvan, et me ei tohiks vahele jätta, sest need on näidanud paljutõotavaid tulemusi, mis võivad praegust standardit muuta. Selles artiklis olen näidanud teile lugemiseks 9 parimat ML-i dokumenti, alates generatiivsest mudelist, aegridade mudelist kuni töövoo tõhususeni. Loodan, et see aitab.

Cornelius Yudha Wijaya on andmeteaduse juhi assistent ja andmete kirjutaja. Allianz Indonesias täiskohaga töötades armastab ta sotsiaalmeedia ja kirjutamismeedia kaudu Pythoni ja Data näpunäiteid jagada.