Paremate tehisintellekti mudelite loomiseks "musta kasti" lahtipakkimine

Paremate tehisintellekti mudelite loomiseks "musta kasti" lahtipakkimine

Allikasõlm: 1885922

Kui süvaõppemudeleid kasutatakse reaalses maailmas, võib-olla krediitkaarditegevusega seotud finantspettuste tuvastamiseks või vähi tuvastamiseks meditsiinilistel piltidel, suudavad need sageli inimesi edestada.

Aga mida need süvaõppe mudelid täpselt õpivad? Kas modell, kes on koolitatud märkama nahavähki näiteks kliinilistel piltidel, õpib tegelikult vähikoe värve ja tekstuure või märgib see mingeid muid tunnuseid või mustreid?

Need võimsad masinõppe mudelid põhinevad tavaliselt kunstlikud närvivõrgud millel võib olla miljoneid sõlme, mis töötlevad andmeid prognooside tegemiseks. Nende keerukuse tõttu kutsuvad teadlased neid mudeleid sageli "mustadeks kastideks", sest isegi neid ehitavad teadlased ei mõista kõike, mis kapoti all toimub.

Stefanie Jegelka ei ole selle "musta kasti" seletusega rahul. MITi elektrotehnika ja arvutiteaduse osakonna äsja ametis olnud dotsent Jegelka tegeleb sügava õppimisega, et mõista, mida need mudelid saavad õppida ja kuidas nad käituvad, ning kuidas nendesse mudelitesse teatud eelteavet ehitada.

„Lõpuks sõltub see, mida süvaõppe mudel õpib, nii paljudest teguritest. Kuid praktikas asjakohase arusaamise loomine aitab meil kujundada paremaid mudeleid ja mõista ka nende sees toimuvat, et saaksime teada, millal saame mudeli kasutusele võtta ja millal mitte. See on kriitilise tähtsusega, ”ütleb Jegelka, kes on ka arvutiteaduse ja tehisintellekti labori (CSAIL) ning andmete, süsteemide ja ühiskonna instituudi (IDSS) liige.

Jegelka on eriti huvitatud masinõppe mudelite optimeerimisest, kui sisendandmed on graafikute kujul. Graafikuandmed kujutavad endast konkreetseid väljakutseid: näiteks andmetes sisalduv teave koosneb nii üksikute sõlmede ja servade teabest kui ka struktuurist – mis on millega seotud. Lisaks on graafikutel matemaatilised sümmeetriad, mida masinõppemudel peab arvestama, et näiteks sama graafik viiks alati sama ennustuseni. Selliste sümmeetriate ehitamine masinõppe mudeliks ei ole tavaliselt lihtne.

Võtke näiteks molekulid. Molekule saab kujutada graafikutena, mille tipud vastavad aatomitele ja servad, mis vastavad nendevahelistele keemilistele sidemetele. Ravimifirmad võivad soovida kasutada süvaõpet, et kiiresti ennustada paljude molekulide omadusi, vähendades arvu, mida nad peavad laboris füüsiliselt testima.

Jegelka uurib meetodeid matemaatiliste masinõppemudelite loomiseks, mis suudavad tõhusalt võtta graafilisi andmeid sisendina ja väljastada midagi muud, antud juhul molekuli keemiliste omaduste prognoosi. See on eriti keeruline, kuna molekuli omadusi ei määra mitte ainult selles sisalduvad aatomid, vaid ka nendevahelised ühendused.  

Teised näited graafikute masinõppest hõlmavad liikluse marsruutimist, kiibi disaini ja soovitussüsteeme.

Nende mudelite kujundamise muudab veelgi keerulisemaks asjaolu, et nende koolitamiseks kasutatavad andmed erinevad sageli andmetest, mida mudelid praktikas näevad. Võib-olla koolitati mudelit väikeste molekulaarsete graafikute või liiklusvõrkude abil, kuid graafikud, mida see pärast kasutuselevõttu näeb, on suuremad või keerukamad.

Mida võivad teadlased sel juhul oodata, et see mudel õpiks ja kas see ikkagi töötab praktikas, kui tegelikud andmed on erinevad?

"Teie mudel ei saa arvutiteaduse mõningate keerukusprobleemide tõttu kõike õppida, kuid see, mida saate õppida ja mida mitte, sõltub mudeli seadistamisest, " ütleb Jegelka.

Ta läheneb sellele küsimusele, ühendades oma kire algoritmide ja diskreetse matemaatika vastu ning põnevusega masinõppe vastu.

Liblikast bioinformaatikani

Jegelka kasvas üles Saksamaal väikelinnas ja huvi teaduse vastu tekkis juba keskkooliõpilasena; toetav õpetaja julgustas teda osalema rahvusvahelisel loodusteaduste konkursil. Tema ja tema meeskonnakaaslased USA-st ja Singapurist võitsid auhinna veebisaidi eest, mille nad lõid liblikate kohta kolmes keeles.

“Oma projekti jaoks tegime kohalikus rakenduskõrgkoolis skaneeriva elektronmikroskoobiga tiibadest pilte. Samuti sain Mercedes Benzis võimaluse kasutada kiirkaamerat — see kaamera filmis tavaliselt sisepõlemismootoreid —, millega jäädvustasin aegluubis video liblika tiibade liikumisest. See oli esimene kord, kui ma reaalselt teaduse ja uurimisega kokku puutusin,” meenutab ta.

Nii bioloogiast kui matemaatikast huvitatud Jegelka otsustas asuda bioinformaatika erialale Tübingeni ülikoolis ja Texase ülikoolis Austinis. Tal oli paar võimalust bakalaureuseõppena teadustööd teha, sealhulgas Georgetowni ülikoolis arvutusliku neuroteaduse praktikal, kuid ta polnud kindel, millist karjääri jätkata.

Kolledži viimasele aastale naastes kolis Jegelka kahe toakaaslase juurde, kes töötasid Tübingeni Max Plancki Instituudis uurimisassistentidena.

"Nad töötasid masinõppe kallal ja see kõlas minu jaoks väga lahedalt. Pidin bakalaureusetöö kirjutama, nii et küsisin instituudis, kas neil on minu jaoks projekt. Hakkasin Max Plancki Instituudis masinõppega tegelema ja see meeldis mulle. Õppisin seal nii palju ja see oli suurepärane koht uurimistööks,” räägib ta.

Ta jäi Max Plancki Instituuti, et lõpetada magistritöö, ja seejärel asus ta doktorikraadi masinõppe alal Max Plancki Instituudis ja Šveitsi Föderaalses Tehnoloogiainstituudis..

Doktoritöö ajal uuris ta, kuidas diskreetse matemaatika mõisted võivad aidata parandada masinõppe tehnikaid.

Mudelite õpetamine õppima

Mida rohkem Jegelka masinõppest õppis, seda enam huvitasid teda väljakutsed, mis on seotud mudelite käitumise ja käitumise juhtimisega.

"Masinõppega saate nii palju ära teha, kuid ainult siis, kui teil on õige mudel ja andmed. See ei ole lihtsalt musta kasti asi, kuhu viskad andmetele ja see töötab. Peate tegelikult mõtlema sellele, selle omadustele ja sellele, mida soovite, et mudel õpiks ja teeks, " ütleb ta.

Pärast Berkeley California ülikooli järeldoktori lõpetamist jäi Jegelka teadustöösse ja otsustas teha karjääri akadeemilises ringkonnas. Ta liitus MIT-i teaduskonnaga 2015. aastal dotsendina.

„Mis mulle algusest peale MIT-i juures väga meeldis, oli see, et inimesed hoolivad väga uurimistööst ja loovusest. See on see, mida ma MIT-i juures kõige rohkem hindan. Siinsed inimesed hindavad väga originaalsust ja uurimistöö sügavust, ”ütleb ta.

See keskendumine loovusele on võimaldanud Jegelkal uurida mitmesuguseid teemasid.

Koostöös teiste MIT-i õppejõududega õpib ta masinõppe rakendusi bioloogias, pildistamises, arvutinägemises ja materjaliteaduses.

Kuid see, mis Jegelkat tegelikult ajendab, on masinõppe põhialuste uurimine ja viimati robustsuse küsimus. Sageli töötab mudel koolitusandmetega hästi, kuid selle jõudlus halveneb, kui seda kasutatakse veidi erinevatel andmetel. Eelteadmiste ehitamine mudelisse võib muuta selle usaldusväärsemaks, kuid aru saada, millist teavet mudel vajab edukaks toimimiseks ja kuidas seda sisse ehitada, pole nii lihtne, ütleb ta.

Ta uurib ka meetodeid piltide klassifitseerimise masinõppemudelite toimivuse parandamiseks.

Piltide klassifitseerimise mudelid on kõikjal, alates mobiiltelefonide näotuvastussüsteemidest kuni tööriistadeni, mis tuvastavad sotsiaalmeedias võltskontosid. Need mudelid vajavad treenimiseks tohutul hulgal andmeid, kuid kuna miljonite piltide käsitsi märgistamine on inimestele kallis, kasutavad teadlased selle asemel mudelite eelkoolitamiseks sageli märgistamata andmekogumeid.

Need mudelid kasutavad õpitud esitusi uuesti, kui neid hiljem konkreetse ülesande jaoks peenhäälestatakse.

Ideaalis soovivad teadlased, et mudel õpiks eelkoolituse ajal nii palju kui võimalik, et saaks neid teadmisi oma järgnevas ülesandes rakendada. Kuid praktikas õpivad need mudelid sageli selgeks vaid mõned lihtsad korrelatsioonid – näiteks, et ühel pildil on päikesepaiste ja teisel vari – ning kasutavad neid „otseteid” piltide klassifitseerimiseks.

"Näitasime, et see on probleem "kontrastiivses õppimises", mis on nii teoreetiliselt kui ka empiiriliselt eelkoolituse standardtehnika. Kuid näitame ka, et saate mõjutada seda, millist teavet mudel esitama õpib, muutes mudelis kuvatavate andmete tüüpe. See on üks samm selle poole, et mõista, mida mudelid tegelikult praktikas teevad, ”ütleb ta.

Teadlased ei mõista ikka veel kõike, mis süvaõppe mudeli sees toimub, ega üksikasju selle kohta, kuidas nad saavad mõjutada seda, mida mudel õpib ja kuidas see käitub, kuid Jegelka ootab huviga nende teemade uurimist.

“Tihtipeale näeme masinõppes midagi juhtumas praktikas ja püüame sellest teoreetiliselt aru saada. See on tohutu väljakutse. Soovite luua arusaama, mis vastab praktikas nähtule, et saaksite paremini teha. Oleme selle mõistmise alles alguses,” ütleb ta.

Väljaspool laborit on Jegelka muusika, kunsti, reisimise ja jalgrattasõidu fänn. Kuid tänapäeval veedab ta suurema osa vabast ajast oma eelkooliealise tütrega.

<!–
->

Ajatempel:

Veel alates Blockchaini konsultandid