Tekstin automaattinen täydennysjärjestelmien tavoitteena on helpottaa elämäämme, mutta niihin liittyy riskejä

Julkaissut Platon

seuraajia: 0

Kuule tietohallintojohtajilta, teknisiltä johtajilta ja muilta C-tason ja johtajilta data- ja tekoälystrategioista Future of Work -huippukokouksessa 12. tammikuuta 2022. Lisätietoja

Jos olet kirjoittanut tekstiviestin tai sähköpostin äskettäin, sinulle todennäköisesti ehdotetaan tekoälyä eri synonyymejä, lauseita tai tapoja lopettaa lause. Tekoälypohjaisten automaattisten ehdotustyökalujen, kuten Googlen Smart Composen, nousu on sattunut samaan aikaan yritysviestinnän digitaalisen muutoksen kanssa, joka nykyään elää enimmäkseen verkossa. Sen arvioidaan että tyypillinen työntekijä vastaa noin 40 sähköpostiin joka päivä ja lähettää yli 200 Slack-viestiä viikossa.

Viestintä uhkaa kuluttaa yhä suuremman osan työpäivästä Adoben kanssa sitominen aika, jonka työntekijät käyttävät sähköposteihin vastaamiseen 15.5 tuntia viikossa. Jatkuva työtehtävien vaihtaminen on kuolinsyy tuottavuudelle, jonka tutkimukset osoittavat hyötyä keskeytymättömästä työstä. tutkimus Kalifornian yliopiston ja Humboldtin yliopiston tutkijat havaitsivat, että työntekijät voivat menettää jopa 23 minuuttia tehtävään aina, kun heidät keskeytetään, pidentää edelleen työpäivä.

Automaattiset ehdotustyökalut lupaavat säästää aikaa virtaviivaistamalla viestien kirjoittamista ja vastaamista. Esimerkiksi Googlen Smart Reply ehdottaa nopeita vastauksia sähköposteihin, joiden kirjoittaminen vie yleensä minuutteja. Mutta näiden työkalujen taustalla olevassa tekoälyssä on puutteita, jotka voivat aiheuttaa harhaa tai vaikuttaa viestien kieleen ei-toivotulla tavalla.

Automaattisen ehdotuksen ja tekstin täydennyksen kasvu

Ennustava teksti ei ole uusi tekniikka. Yksi ensimmäisistä laajalti saatavilla olevista esimerkeistä, T9, joka mahdollistaa sanojen muodostamisen yhdellä näppäimen painalluksella jokaista kirjainta kohden, tuli vakiona moniin matkapuhelimiin 90-luvun lopulla. Mutta kehittyneempien, skaalautuvien tekoälytekniikoiden tulo kieleen johti harppauksiin automaattisten ehdotustyökalujen laadussa ja laajuudessa.

Vuonna 2017 Google lanseerasi Älykäs vastaus Gmailissa, jonka yritys toi myöhemmin muihin Googlen palveluihin, mukaan lukien Chat ja kolmannen osapuolen sovellukset. Googlen mukaan Smart Replyn takana oleva tekoäly luo vastausehdotuksia "keskustelun koko kontekstin perusteella", ei vain yksittäisen viestin, mikä näennäisesti johtaa ehdotuksiin, jotka ovat ajankohtaisempia ja osuvampia. Älykäs säveltäminen, joka ehdottaa kokonaisia virkkeitä sähköposteissa, saapui Gmailiin vuotta myöhemmin ja Google-dokumentteihin pian sen jälkeen. Samanlainen ominaisuus ns ehdotti vastauksia tuli Microsoft Outlookiin vuonna 2018 ja Teamsiin vuonna 2020.

Uuden automaattisuggestion työkalujen – joita jotkut akateemiset piirit kutsuvat "AI-välitteiseksi kommunikaatioksi" - takana oleva teknologia on harppauksia pidemmälle kuin 90-luvulla. Esimerkiksi Smart Composen taustalla oleva tekoälymalli luotiin käyttämällä miljardeja esimerkkejä sähköposteista ja toimii pilvessä mukautetulla kiihdytinlaitteistolla. Samaan aikaan Smart Reply – joka toimi perustana Smart Composelle – ottaa ehdotuksiin "hierarkkisen lähestymistavan", joka on saanut inspiraationsa siitä, miten ihmiset ymmärtävät kieliä ja käsitteitä.

Yllä: Outlookin Smart Reply käyttää Azure Machine Learningiin koulutettuja syväoppimismalleja.

Kuvaluotto: Microsoft

"Kielen sisältö on syvästi hierarkkinen, heijastuu itse kielen rakenteeseen..." Googlen tutkija Brian Strope ja suunnittelujohtaja Ray Kurzweil selittää blogikirjoituksessa. "Ajattele viestiä: 'Se mielenkiintoinen henkilö kahvilassa, josta pidämme, vilkaisi minua." … Ehdottaessamme sopivaa vastausta tähän viestiin saatamme harkita sanan "vilkaisu" merkitystä, joka on mahdollisesti moniselitteinen. Oliko se positiivinen ele? Siinä tapauksessa saatamme vastata: "Cool!" Vai oliko se negatiivinen ele? Jos on, kertooko aihe jotain siitä, mitä kirjoittaja koki negatiivisesta vaihdosta? Hienovaraisten erojen tekemiseen tarvitaan paljon tietoa maailmasta ja kykyä tehdä perusteltuja arvioita. Kun annetaan tarpeeksi esimerkkejä kielestä, koneoppimisen lähestymistapa voi löytää monia näistä hienovaraisista eroista. ”

Mutta kuten kaikki tekniikat, jopa kaikkein tehokkaimmat automaattiset ehdotustyökalut ovat alttiita virheille, joita ilmenee kehitys- ja käyttöönottoprosessin aikana.

Joulukuussa 2016 se oli paljasti että Google-haun automaattinen täydennysominaisuus ehdotti vihamielisiä ja loukkaavia päätteitä tietyille hakulausekkeille, kuten "ovatko juutalaiset pahoja?" ilmaisulle "ovat juutalaisia". Yrityksen mukaan syynä oli algoritminen järjestelmä, joka päivittää ehdotuksia sen perusteella, mitä muut käyttäjät ovat viime aikoina hakeneet. Vaikka Google lopulta toteutti korjauksen, kesti vielä useita vuosia, ennen kuin yritys esti automaattisen täydennyksen ehdotukset kiistanalaisia poliittisia lausuntoja mukaan lukien vääriä väitteitä äänestysvaatimuksista ja vaaliprosessien laillisuudesta.

Älykäs vastaus on ollut löytyi tarjota "turbaania käyttävälle henkilölle" emoji vastauksena viestiin, joka sisälsi aseemojin. Ja Applen automaattinen täydennys iOS:ssä aiemmin ehdotti vain miesemojia johtotehtäviin, mukaan lukien toimitusjohtaja, COO ja teknologiajohtaja.

Puolueet tiedot

Automaattisen täydennyksen ja automaattisen ehdotuksen järjestelmien puutteet johtuvat usein puolueellisista tiedoista. Miljoonat tai miljardit esimerkit, joista järjestelmät oppivat, voivat pilata tekstiä myrkyllisiä verkkosivustoja jotka yhdistävät tiettyjä sukupuolia, rotuja, etnisyydet, ja uskonnot, joilla on vahingollisia käsitteitä. Havainnollistaen ongelmaa, Codex, tutkimuslaboratorio OpenAI:n kehittämä koodinmuodostusmalli, joka voidaan kehottaa kirjoittamaan "terroristi", kun sille syötetään sana "islam". Toinen suuri kielimalli tekoälyn käynnistyksestä Yhtenäinen pyrkii yhdistämään miehet ja naiset stereotyyppisiin "mies- ja naispuolisiin" ammatteihin, kuten "miestieteilijöitä" ja "naispuolisia taloudenhoitajaa".

Älykäs kirjoittaminen Google-dokumentteihin

Yllä: Smart Compose for Google Docs.

Tietojen merkinnät voivat aiheuttaa uusia ongelmia – tai pahentaa olemassa olevia. Koska monet mallit oppivat tarroista, jotka kertovat siitä, onko sanalla, lauseella, kappaleella tai asiakirjalla tiettyjä ominaisuuksia, kuten positiivinen tai negatiivinen tunne, yritykset ja tutkijat värväävät ihmisryhmiä merkitsemään esimerkkejä, tyypillisesti joukkolähdealustoista, kuten Amazon Mechanical Turk. Nämä kommentaattorit tuovat taulukkoon omat näkökulmansa - ja harhaanjohtamisensa.

Allen Institute for AI:n, Carnegie Mellonin ja Washingtonin yliopiston tekemässä tutkimuksessa tutkijat havaitsivat, että merkinnät merkitsevät todennäköisemmin afroamerikkalaisen englannin (AAE) murretta myrkyllisempiä lauseita kuin yleiset amerikkalaisen englannin vastineet – vaikka ne ymmärretään. myrkyttömänä AAE-kaiuttimien ansiosta. Palapeli, Googlen emoyhtiön Alphabetin alaisuudessa toimiva organisaatio verkkokiusaamisen ja disinformaation torjumiseksi, on tehnyt samanlaisia johtopäätöksiä kokeissaan. Yrityksen tutkijat ovat havainneet eroja merkintöjen välillä, jotka tunnistavat itsensä afrikkalaisamerikkalaisiksi ja LGBTQ+ -yhteisön jäseniksi verrattuna merkintöihin, jotka eivät tunnista kumpaakaan näistä ryhmistä.

Joskus harha on tahallista - kysymys kansankielestä kompromisseista. Esimerkiksi, KirjailijaSisällön luomiseen tekoälyavustajaa kehittävä startup sanoo, että se asettaa kirjoitusehdotuksissaan etusijalle "bisnesenglannin". Toimitusjohtaja May Habib antoi esimerkin "tavanomaisesta olla" AAVE:ssa, verbimuodossa, jota ei ole olemassa missään muussa englannin kielen tyylissä.

"Koska [tavallista olla] ei perinteisesti ole käytetty bisnesenglannin kielessä, joten se ei näy usein tiedoissamme, korjaamme sanan "teette täällä outoja asioita" sanaksi "Y". kaikki tekevät täällä outoja asioita", Habib kertoi VentureBeatille sähköpostitse. "[Se sanoi,] varmistimme manuaalisesti, että Writer ei merkitsisi kansankielisiä tervehdyksiä ja allekirjoituksia. Jotkut kansankielet ovat sukupuolineutraalimpia kuin muodollinen bisnesenglannin [esimerkiksi], joten se on nykyaikaisempaa ja yrityksiin kuuluvampaa.”

Kirjoittamiseen vaikuttaminen

Kun harhat – tahalliset tai eivät – pääsevät automaattiseen täydennys- ja ehdotusjärjestelmiin, ne voivat muuttaa tapaamme kirjoittaa. Näiden järjestelmien valtava toiminta-aste tekee niistä vaikean (ellei mahdoton) välttää kokonaan. Älykäs vastaus oli vastuullinen 10 % kaikista Gmail-vastauksista, jotka lähetettiin älypuhelimilla vuonna 2016.

Yhdessä kattavammista tarkastukset Automaattisen täydennyksen työkaluista Microsoftin tutkijaryhmä haastatteli vapaaehtoisia, joita käskettiin kertomaan mielipiteensä automaattisesti luoduista vastauksista Outlookissa. Haastateltavat pitivät osan vastauksista ylipositiivisina, vääriä oletuksiaan kulttuurista ja sukupuolesta ja liian epäkohteliaksi tiettyihin yhteyksiin, kuten yrityskirjeenvaihtoon. Silti tutkimuksen aikana tehdyt kokeet osoittivat, että käyttäjät suosivat todennäköisemmin Outlookin ehdottamia lyhyitä, positiivisia ja kohteliaita vastauksia.

Google SmartReply YouTube

Erillinen Harvard-tutkimus osoitti, että kun ravintolasta kirjoittaville ihmisille esitettiin "positiivisia" automaattisen täydennyksen ehdotuksia, tuloksena saadut arvostelut olivat yleensä positiivisempia kuin jos heille esitettiin negatiivisia ehdotuksia. "On jännittävää ajatella, kuinka tulevaisuuden ennustavat tekstijärjestelmät voivat auttaa ihmisiä tulemaan paljon tehokkaammiksi kirjoittajiksi, mutta tarvitsemme myös läpinäkyvyyttä ja vastuullisuutta suojautuaksemme ehdotuksilta, jotka voivat olla puolueellisia tai manipuloituja", Ken Arnold, Harvardin koulun tutkija. tutkimuksessa mukana olleet tekniikat ja sovelletut tieteet, kertoi BBC.

Jos haitallisen automaattisen täydennyksen ongelmaan on olemassa kaikenkattava ratkaisu, sitä ei ole vielä löydetty. Google päätti yksinkertaisesti estää sukupuoleen perustuvat pronominiehdotukset Smart Compose -sovelluksessa, koska järjestelmä osoittautui huonoksi ennustajaksi vastaanottajien sukupuoleen ja sukupuoli-identiteettiin. Microsoftin LinkedIn välttää myös sukupuoleen perustuvat pronominit ennakoivassa viestityökalussaan Smart Repliesissä mahdollisten virheiden estämiseksi.

Microsoftin tekijät opiskella varoittaa, että jos järjestelmäsuunnittelijat eivät korjaa ennakoivasti automaattisen täydennyksen tekniikoiden puutteita, heillä on vaara, että käyttäjät eivät vain loukkaa käyttäjiä, vaan saavat heidät luottamaan järjestelmiin. "Järjestelmäsuunnittelijoiden tulisi tutkia personointistrategioita yksilötasolla ja sosiaalisen verkoston tasolla, pohtia, kuinka kulttuuriset arvot ja yhteiskunnalliset ennakkoluulot voivat jatkua heidän järjestelmissään, ja tutkia sosiaalisen vuorovaikutuksen mallintamista voidakseen alkaa puuttua rajoituksiin ja ongelmiin", he kirjoittivat. "Tuloksemme osoittavat, että nykyiset sähköpostin ja muiden [samankaltaisten] tekniikoiden tekstisuositusjärjestelmät eivät ole riittävän vivahteikkaat heijastamaan todellisten sosiaalisten suhteiden ja viestintätarpeiden hienouksia. "

VentureBeat

VentureBeatin tehtävänä on olla digitaalinen kaupungin aukio teknisille päätöksentekijöille saadakseen tietoa muuttuvasta tekniikasta ja kaupoista. Sivustomme tarjoaa olennaisia tietoja tietotekniikoista ja strategioista, jotka ohjaavat sinua organisaatiosi johdossa. Kutsumme sinut tulemaan yhteisömme jäseneksi ja tutustumaan:

ajantasaista tietoa sinua kiinnostavista aiheista
uutiskirjeemme
aidattu ajattelijan sisältö ja alennettu pääsy arvostettuihin tapahtumiin, kuten Muuta 2021: Lisätietoja
verkko-ominaisuudet ja paljon muuta

Tule jäseneksi

Lähde: https://venturebeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

Aikaleima: Tammikuu 11, 2022