Text Autocompletion Systems Aim To Ease Our Lives, But There Are Risks

Taasavaldanud Platon

järgijaid: 0

12. jaanuaril 2022 toimuval Future of Work tippkohtumisel saate teavet IT-juhtide, tehnoloogiajuhtide ja teiste C-taseme ja kõrgemate tippjuhtide kohta andmete ja tehisintellekti strateegiate kohta. Loe edasi

Kui olete hiljuti tekstisõnumi või meili kirjutanud, on tõenäoline, et tehisintellekt soovitab teile erinevaid sünonüüme, fraase või lause lõpetamise viise. Tehisintellektil põhinevate automaatsete soovituste tööriistade, nagu Google'i Smart Compose'i kasv langes kokku ettevõtte suhtluse digitaalse ümberkujundamisega, mis praegu elab peamiselt võrgus. See on Hinnanguliselt et tüüpiline töötaja vastab iga päev umbes 40 meilile ja saadab rohkem kui 200 Slacki sõnumit nädalas.

Sõnumite saatmine ähvardab Adobe'iga kulutada üha suurema osa tööpäevast tikutus aeg, mille töötajad kulutavad meilidele vastamisele 15.5 tundi nädalas. Pidev tööülesannete vahetamine on tootlikkusele surmanuhtlus, mille uuringud näitavad katkematust tööst kasu. uurimistöö California ülikooli ja Humboldti ülikooli uuringud leidsid, et töötajad võivad iga katkestamise korral ülesande täitmisel kaotada kuni 23 minutit, edasine pikendamine tööpäev.

Automaatse soovituse tööriistad lubavad säästa aega, muutes sõnumite kirjutamise ja vastamise sujuvamaks. Näiteks Google'i nutikas vastus soovitab kiireid vastuseid meilidele, mille väljatrükkimine võtab tavaliselt minuteid. Kuid nende tööriistade taga oleval tehisintellektil on puudusi, mis võivad põhjustada eelarvamusi või mõjutada sõnumite saatmisel kasutatavat keelt soovimatul viisil.

Automaatsoovituse ja teksti automaatse täitmise kasv

Ennustav tekst ei ole uus tehnoloogia. Üks esimesi laialt kättesaadavaid näiteid, T9, mis võimaldab sõnu moodustada iga tähe jaoks ühest klahvivajutusest, tuli 90ndate lõpus paljude mobiiltelefonide standardvarustusse. Kuid keerukamate, mastaapsemate AI-tehnikate tulek keelde tõi kaasa hüppe automaatse soovitamise tööriistade kvaliteedis ja laiuses.

2017. aastal käivitas Google Tark vastus Gmailis, mille ettevõte tõi hiljem ka teistele Google'i teenustele, sealhulgas vestlusele ja kolmandate osapoolte rakendustele. Google'i sõnul genereerib nutika vastuse taga olev tehisintellekt vastusesoovitusi "vestluse täieliku konteksti alusel", mitte ainult ühe sõnumi põhjal – mille tulemuseks on näiliselt õigeaegsemad ja asjakohasemad soovitused. Smart Compose, mis soovitab meilides täislauseid, jõudis Gmaili aasta hiljem ja Google Docsi varsti pärast seda. Sarnane funktsioon nimega soovitatud vastused jõudis Microsoft Outlooki 2018. aastal ja Teamsi 2020. aastal.

Automaatsoovitustööriistade uue saagi – mida mõned akadeemilised ringkonnad nimetavad „AI-vahendatud suhtluseks” – taga olev tehnoloogia on hüppeliselt kaugemale 90ndatel. Näiteks Smart Compose'i aluseks olev tehisintellekti mudel loodi miljardite e-kirjade näidete abil ja töötab pilves kohandatud kiirendi riistvaras. Samal ajal kasutab Smart Reply – mis oli Smart Compose’i aluseks – ettepanekutele "hierarhiline lähenemine", mis on inspireeritud sellest, kuidas inimesed keeli ja mõisteid mõistavad.

Ülal: Outlooki nutikas vastus kasutab süvaõppemudeleid, mis on koolitatud Azure'i masinõppes.

Pildikrediit: Microsoft

"Keele sisu on sügavalt hierarhiline, peegeldub keele enda struktuuris ..." Google'i teadur Brian Strope ja inseneridirektor Ray Kurzweil selgitama blogipostituses. "Mõelge sõnumile: "See huvitav inimene kohvikus, kes meile meeldib, heitis mulle pilgu." … Sellele sõnumile sobiva vastuse pakkumisel võiksime kaaluda sõna „pilk” tähendust, mis võib olla mitmetähenduslik. Kas see oli positiivne žest? Sel juhul võime vastata: "Lahe!" Või oli see negatiivne žest? Kui jah, siis kas teema räägib midagi selle kohta, kuidas kirjanik negatiivsesse vahetusse suhtus? Peente vahetegemiseks on vaja palju teavet maailma kohta ja oskust teha põhjendatud otsuseid. Piisavalt keelenäiteid arvestades võib masinõppe lähenemisviis avastada palju neid peeneid erinevusi. ”

Kuid nagu kõigi tehnoloogiate puhul, on isegi kõige võimekamad automaatse soovituse tööriistad vastuvõtlikud vigadele, mis ilmnevad arendus- ja juurutamisprotsessi käigus.

2016. aasta detsembris oli selgus et Google'i otsingu automaatse täitmise funktsioon soovitas konkreetsetele otsingufraasidele vaenu õhutavaid ja solvavaid lõppu, näiteks "kas juudid on kurjad?" fraasi "on juudid" jaoks. Ettevõtte sõnul oli süüdi algoritmiline süsteem, mis värskendab soovitusi selle põhjal, mida teised kasutajad on hiljuti otsinud. Kuigi Google lõpuks paranduse rakendas, kulus ettevõttel veel mitu aastat, enne kui automaatse täitmise soovitused blokeerisid vastuolulised poliitilised avaldused sealhulgas valeväiteid hääletamisnõuete ja valimisprotsessi legitiimsuse kohta.

Nutikas vastus on olnud avastatud et pakkuda turbani kandvale inimesele emotikone vastuseks sõnumile, mis sisaldas relva emotikonit. Ja Apple'i automaatne lõpetamine iOS-is varem soovitas ainult meessoost emotikone juhtivate rollide jaoks, sealhulgas tegevjuht, COO ja CTO.

Kallutatud andmed

Automaatse täitmise ja automaatse soovituse süsteemide vead tulenevad sageli kallutatud andmetest. Miljonid kuni miljardid näited, millest süsteemid õpivad, võivad olla tekstiga rikutud mürgised veebisaidid mis seovad teatud sugusid, rasse, rahvusedja religioonid, millel on kahjulikud kontseptsioonid. Probleemi illustreerides, Koodeks, mis on uurimislabori OpenAI välja töötatud koodi genereeriv mudel, mille puhul võidakse sisestada sõna "islam" ja see võib panna kirjutama "terrorist". Veel üks suur keelemudel AI käivitamiselt Sidus kipub seostama mehi ja naisi stereotüüpselt "meeste" ja "naiste" ametitega, nagu "meesteadlane" ja "naissoost majahoidja".

Nutikas koostamine Google'i dokumentide jaoks

Ülal: nutikas koostamine Google Docsi jaoks.

Andmetes olevad märkused võivad tekitada uusi probleeme või süvendada olemasolevaid. Kuna paljud mudelid õpivad siltidest, mis annavad teada, kas sõnal, lausel, lõigul või dokumendil on teatud omadused, näiteks positiivne või negatiivne meeleolu, värbavad ettevõtted ja teadlased inimannotaatorite meeskondi, et märgistada näiteid, tavaliselt ühishankeplatvormidelt nagu Amazon Mechanical Turk. Need annotaatorid toovad tabelisse oma vaatenurgad ja eelarvamused.

Alleni AI-instituudi, Carnegie Melloni ja Washingtoni ülikooli uuringus leidsid teadlased, et märgistajad märgivad tõenäolisemalt afroameerika inglise (AAE) dialekti fraase, mis on mürgisemad kui üldised Ameerika inglise keele vasted – hoolimata sellest, et neid mõistetakse. mittetoksilisena AAE kõlarite poolt. Jigsaw, Google'i emaettevõtte Alphabeti alluvuses töötav organisatsioon, et võidelda küberkiusamise ja desinformatsiooniga, on oma katsetes teinud sarnased järeldused. Ettevõtte teadlased on avastanud erinevusi annotatsioonides end afroameeriklasteks identifitseerivate märgistajate ja LGBTQ+ kogukonna liikmete ja annotaatorite vahel, kes ei tunnista end kumbki neist rühmadest.

Mõnikord on eelarvamus tahtlik - rahvakeelsete kompromisside küsimus. Näiteks, kirjanikidufirma, kes arendab sisu genereerimiseks tehisintellekti abilist, ütleb, et seab oma kirjutamissoovitustes esikohale äriinglise keele. Tegevjuht May Habib tõi näite "harjumuspärasest olemisest" AAVE-s, verbi ajavormis, mida üheski teises inglise keele stiilis ei eksisteeri.

“Since [the habitual be] traditionally hasn’t been used in business English, and thus doesn’t show up in high frequency in our datasets, we would correct ‘Y’all be doing some strange things out here’ to ‘Y’all are doing some strange things out here,’” Habib told VentureBeat via email. “[That said,] we did manually ensure that vernacular-based greetings and sign-offs would not be flagged by Writer. Some vernacular is more gender-neutral than formal business English, [for instance,] so is more modern and on-brand for companies.”

Kirjutamise mõjutamine

Kui eelarvamused – tahtlikud või mitte – muutuvad automaatse täitmise ja automaatse soovitamise süsteemidesse, võivad need muuta meie kirjutamisviisi. Nende süsteemide töö tohutu ulatus muudab nende täieliku vältimise keeruliseks (kui mitte võimatuks). Tark vastus oli vastutav 10% kõigist 2016. aastal nutitelefonidest saadetud Gmaili vastustest.

Ühes kõikehõlmavamas auditid automaatse täitmise tööriistade kohta viis Microsofti teadlaste meeskond intervjuud vabatahtlikega, kellel paluti Outlookis automaatselt genereeritud vastuste kohta oma mõtteid avaldada. Intervjueeritavad leidsid, et mõned vastused olid liiga positiivsed, nende eeldused kultuuri ja soo kohta olid valed ning liiga ebaviisakad teatud kontekstide, näiteks ettevõtete kirjavahetuse jaoks. Sellegipoolest näitasid uuringu käigus tehtud katsed, et kasutajad eelistasid Outlooki soovitatud lühikesi, positiivseid ja viisakaid vastuseid.

Google SmartReply YouTube

Eraldi Harvardi uuringus leiti, et kui restoranist kirjutavatele inimestele esitati "positiivseid" automaatse täitmise soovitusi, olid sellest tulenevad arvustused positiivsemad kui negatiivsete soovitustega. "On põnev mõelda, kuidas tuleviku ennustavad tekstisüsteemid võivad aidata inimestel saada palju tõhusamateks kirjutajateks, kuid me vajame ka läbipaistvust ja vastutust, et kaitsta ettepanekute eest, mis võivad olla kallutatud või manipuleeritud," Harvardi kooli teadlane Ken Arnold. inseneri- ja rakendusteadused, kes osalesid uuringus, ütles BBC.

Kui kahjuliku automaatse täitmise probleemile on olemas kõikehõlmav lahendus, pole seda veel avastatud. Google otsustas Smart Compose'is soopõhised asesõnasoovitused lihtsalt blokeerida, kuna süsteem osutus adressaatide soo ja soolise identiteedi halvaks ennustajaks. Microsofti LinkedIn väldib ka oma ennustavas sõnumsidetööriistas Smart Replies soopõhiseid asesõnu, et vältida võimalikke vigu.

Microsofti kaasautorid õppima hoiatage, et kui süsteemidisainerid ei tegele ennetavalt automaatse täitmise tehnoloogiate puudujääkidega, on neil oht mitte ainult kasutajaid solvata, vaid põhjustada nendes süsteemidesse usaldamatust. "Süsteemidisainerid peaksid uurima isikupärastamisstrateegiaid üksikisiku ja sotsiaalse võrgustiku tasandil, kaaluma, kuidas nende süsteemid võivad säilitada kultuurilisi väärtusi ja ühiskondlikke eelarvamusi, ning uurima sotsiaalse suhtluse modelleerimist, et alustada piirangute ja probleemidega tegelemist," kirjutasid nad. „[Meie] tulemused näitavad, et praegused e-posti ja muude [sarnaste] tehnoloogiate tekstisoovitussüsteemid ei ole piisavalt nüansirikkad, et kajastada tegelike sotsiaalsete suhete ja suhtlusvajaduste peensusi. “

VentureBeat

VentureBeati missioon on olla digitaalne linnaväljak tehniliste otsuste tegijatele, et saada teadmisi transformatiivse tehnoloogia ja tehingute kohta. Meie sait pakub olulist teavet andmetehnoloogiate ja strateegiate kohta, mis juhendab teid oma organisatsioonide juhtimisel. Kutsume teid meie kogukonna liikmeks, et pääseda juurde:

ajakohane teave teile huvipakkuvate teemade kohta
meie infolehed
väravaga mõttejuhi sisu ja soodushinnaga juurdepääs meie hinnatud üritustele, näiteks Muuda 2021. aastat: Lisateave
võrgufunktsioonid ja palju muud

Saage liikmeks

Allikas: https://venturebeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

Ajatempel: Jaanuar 11, 2022