Az automatikus szövegkiegészítő rendszerek célja, hogy megkönnyítsék életünket, de vannak kockázatok

Forrás csomópont: 1575782

A 12. január 2022-én megrendezésre kerülő Future of Work Summit alkalmával informatikai igazgatók, technológiai igazgatók és más C-szintű és magas rangú vezetők hallhatnak az adatokról és az AI-stratégiákról. Tudjon meg többet


Ha a közelmúltban szöveges üzenetet vagy e-mailt írt, valószínű, hogy a mesterséges intelligencia különböző szinonimákat, kifejezéseket vagy egy mondat befejezésének módjait javasolja Önnek. A mesterséges intelligencia által vezérelt automatikus szuggesztió eszközök, például a Google Smart Compose megjelenése egybeesett a vállalati kommunikáció digitális átalakulásával, amely ma már többnyire online működik. ez van becsült hogy a tipikus dolgozó naponta körülbelül 40 e-mailre válaszol és küld több mint 200 Slack üzenet hetente.

Az üzenetküldés azzal fenyeget, hogy a munkanapok egyre nagyobb részét felemészti az Adobe-val rögzítettség az az idő, amit a dolgozók e-mailek megválaszolásával töltenek, heti 15.5 órát. A folyamatos feladatváltás a termelékenység haláltusa, amely a tanulmányok szerint a megszakítás nélküli munka előnyeit. Kutatás A Kaliforniai Egyetem és a Humboldt Egyetem kutatói azt találták, hogy a dolgozók akár 23 percet is veszíthetnek egy feladaton minden alkalommal, amikor megszakítják őket. további meghosszabbítása a munkanap.

Az automatikus javaslattételi eszközök az üzenetírás és a válaszadás egyszerűsítésével időt takarítanak meg. A Google Intelligens válasz funkciója például gyors válaszokat javasol az olyan e-mailekre, amelyek gépelése általában percekig tart. Az ezen eszközök mögött meghúzódó mesterséges intelligencia azonban hiányosságokkal rendelkezik, amelyek torzításokat okozhatnak, vagy nemkívánatos módon befolyásolhatják az üzenetküldés nyelvezetét.

Az automatikus javaslat és a szöveg automatikus kiegészítésének növekedése

A prediktív szöveg nem új technológia. Az egyik első széles körben elérhető példa, T9A '90-es évek végén számos mobiltelefonon alapfelszereltségnek számító , amely lehetővé teszi, hogy minden betűhöz egyetlen gombnyomással szavakat képezzenek. A kifinomultabb, skálázható mesterséges intelligencia technikák nyelvi megjelenése azonban ugrásszerű ugrást eredményezett az önszuggesztió eszközök minőségében és terjedelmében.

2017-ban indult a Google Intelligens válasz a Gmailben, amelyet a cég később más Google-szolgáltatásokhoz, köztük a Chathez és a harmadik féltől származó alkalmazásokhoz is hozott. A Google szerint az Intelligens válasz mögött meghúzódó mesterséges intelligencia „a beszélgetés teljes kontextusa alapján” válaszjavaslatokat generál, nem csupán egyetlen üzenetet – látszólag időszerűbb és relevánsabb javaslatokat eredményez. Smart Compose, amely teljes mondatokat sugall az e-mailekben, egy évvel később megérkezett a Gmailbe és a Google Docsba nem sokkal később. Hasonló funkció az ún javasolt válaszok A Microsoft Outlook 2018-ban, a Teams pedig 2020-ban jelent meg.

Az újfajta autoszuggesztiós eszközök mögött meghúzódó technológia – amelyet egyes tudományos körök „AI által közvetített kommunikációnak” neveznek – ugrásszerűen meghaladja a 90-es években létezőt. Például a Smart Compose alapjául szolgáló AI-modellt e-mailek milliárdjainak felhasználásával hozták létre, és a felhőben fut egyedi gyorsító hardveren. Eközben az Intelligens válasz – amely a Smart Compose alapjául szolgált – „hierarchikus megközelítést” alkalmaz a javaslatokhoz, az ihlette, hogy az emberek hogyan értenek meg a nyelveket és a fogalmakat.

Microsoft Smart Reply

Fent: Az Outlook intelligens válasza az Azure Machine Learningben betanított mély tanulási modelleket használ.

Képhitel: Microsoft

„A nyelv tartalma mélyen hierarchikus, magában a nyelv szerkezetében is tükröződik…” – Brian Strope, a Google kutatója és Ray Kurzweil mérnöki igazgató magyarázat egy blogbejegyzésben. „Vegyük fontolóra az üzenetet: „Az az érdekes ember a kávézóban, akit szeretünk, rám pillantott.” … Amikor megfelelő választ javasolunk erre az üzenetre, figyelembe vehetjük a „pillantás” szó jelentését, amely potenciálisan kétértelmű. Pozitív gesztus volt? Ebben az esetben azt válaszolhatjuk, hogy "Cool!" Vagy ez negatív gesztus volt? Ha igen, mond-e a téma valamit arról, hogy az író hogyan vélekedett a negatív eszmecseréről? Sok információra van szükség a világról, és képes kellően megfontolt ítéleteket hozni ahhoz, hogy finom különbségeket tegyünk. Ha elegendő nyelvi példát mutatunk be, a gépi tanulási megközelítés sok ilyen finom különbséget felfedezhet. ”

De mint minden technológia esetében, még a leghatékonyabb önszuggesztió eszközök is érzékenyek a fejlesztési – és telepítési – folyamat során felbukkanó hibákra.

2016 decemberében az volt kiderült hogy a Google Keresés automatikus kiegészítési funkciója gyűlöletkeltő és sértő végződéseket javasolt bizonyos keresési kifejezésekhez, például „a zsidók gonoszak?” a „zsidók” kifejezésre. A cég szerint egy algoritmikus rendszer volt a hibás, amely frissíti a javaslatokat az alapján, amit más felhasználók nemrégiben kerestek. Míg a Google végül végrehajtott egy javítást, több évbe telt, mire a vállalat letiltotta az automatikus kiegészítési javaslatokat ellentmondásos politikai nyilatkozatok ideértve a szavazási követelményekkel és a választási folyamatok legitimitásával kapcsolatos hamis állításokat.

Az Intelligens válasz megtörtént talált felkínálni a „turbánt viselő személy” emojit válaszul egy pisztoly emojit tartalmazó üzenetre. És az Apple automatikus kiegészítése iOS rendszeren korábban csak férfi hangulatjeleket javasolt a vezetői szerepkörökhöz, beleértve a vezérigazgatót, a COO-t és a műszaki igazgatót.

Elfogult adatok

Az automatikus kiegészítési és automatikus javaslattételi rendszerek hibái gyakran torzított adatokból adódnak. A több milliótól milliárdig terjedő példák, amelyekből a rendszerek tanulnak, szöveggel szennyeződhetnek mérgező weboldalak amelyek bizonyos nemeket, fajokat társítanak, etnikumok, és a bántó fogalmakkal rendelkező vallások. Illusztrálva a problémát, Kódex, az OpenAI kutatólaboratórium által kifejlesztett kódgeneráló modell, amely arra késztetheti a „terrorista” szót, ha az „iszlám” szót táplálja. Egy másik nagy nyelvi modell az AI indulásától Összefügg hajlamos a férfiakat és a nőket sztereotip „férfi” és „női” foglalkozásokhoz társítani, mint például a „férfi tudós” és „női házvezetőnő”.

Intelligens levélírás a Google Dokumentumokhoz

Fent: Intelligens levélírás a Google Dokumentumokhoz.

Az adatokban található megjegyzések új problémákat vethetnek fel – vagy súlyosbíthatják a meglévőket. Mivel sok modell tanul azokból a címkékből, amelyek közlik, hogy egy szónak, mondatnak, bekezdésnek vagy dokumentumnak vannak-e bizonyos jellemzői, például pozitív vagy negatív érzés, a vállalatok és kutatók emberi annotátorokból álló csapatokat toboroznak a példák címkézésére, jellemzően közösségi forrásokból, például az Amazon Mechanical Turk-ból. Ezek az annotátorok a saját nézőpontjaikat – és torzításaikat – hozzák az asztalhoz.

Az Allen Institute for AI, Carnegie Mellon és a Washingtoni Egyetem tanulmányában a tudósok arra a következtetésre jutottak, hogy a címkézők nagyobb valószínűséggel jelölik meg az afroamerikai angol (AAE) dialektusban használt kifejezéseket, amelyek mérgezőbbek, mint az általános amerikai angol megfelelők – annak ellenére, hogy megértik őket. az AAE hangszórók nem mérgezőek. LombfűrészHasonló következtetésekre jutott kísérletei során a Google anyavállalata, az Alphabet nevű szervezet is, amely az internetes zaklatás és a dezinformáció leküzdésére törekszik. A cég kutatói különbségeket fedeztek fel a magukat afro-amerikainak valló címkézők és az LMBTQ+ közösség tagjai között az annotációkban, illetve azok között, akik nem azonosulnak e csoportok egyikével sem.

Néha az elfogultság szándékos – köznyelvi kompromisszumok kérdése. Például, ÍróA tartalomgeneráláshoz mesterséges intelligencia asszisztenst fejlesztő startup azt állítja, hogy írási javaslataiban az „üzleti angol” nyelvet helyezi előtérbe. May Habib vezérigazgató példaként hozta fel a „szokásos be” szót az AAVE-ben, egy olyan igeidőt, amely nem létezik más angol stílusban.

„Mivel a [szokásos be] hagyományosan nem használatos az üzleti angol nyelvben, és így nem jelenik meg nagy gyakorisággal az adatkészleteinkben, a „ti mindannyian furcsa dolgokat csináltok itt” kifejezést „Y”-re javítanánk. mindannyian furcsa dolgokat művelnek itt” – mondta Habib a VentureBeatnek e-mailben. „[Egyébként] manuálisan gondoskodtunk arról, hogy a Writer ne jelölje meg a népnyelven alapuló üdvözléseket és aláírásokat. Egyes népnyelvek nemileg semlegesebbek, mint a hivatalos üzleti angol, [például], így a vállalatok számára modernebb és márkára jellemzőbb.

Az írás befolyásolása

Amikor a torzítások – szándékosak vagy nem – bekerülnek az automatikus kiegészítési és önszuggesztiós rendszerekbe, megváltoztathatják az írásmódunkat. Az a hatalmas lépték, amelyben ezek a rendszerek működnek, megnehezíti (ha nem lehetetlen) teljesen elkerülni őket. Intelligens válasz volt felelős 10-ban az okostelefonokról küldött Gmail-válaszok 2016%-a.

Az egyik átfogóbb ellenőrzések Az automatikus kiegészítési eszközök közül a Microsoft kutatóinak egy csoportja interjúkat készített önkéntesekkel, akiknek azt mondták, mondják el véleményüket az Outlookban automatikusan generált válaszokról. Az interjúalanyok a válaszok egy részét túlzottan pozitívnak, tévesnek találták a kultúrával és a nemekkel kapcsolatos feltételezéseikben, valamint túl udvariatlannak bizonyos kontextusokhoz, például a vállalati levelezéshez. Ennek ellenére a tanulmány során végzett kísérletek azt mutatták, hogy a felhasználók nagyobb valószínűséggel részesítették előnyben az Outlook által javasolt rövid, pozitív és udvarias válaszokat.

Google SmartReply YouTube

Egy külön Harvard-tanulmány kimutatta, hogy amikor az étteremről írt embereket „pozitív” automatikus kiegészítési javaslatokkal látták el, a kapott vélemények általában pozitívabbak voltak, mintha negatív javaslatokat kaptak volna. "Izgalmas arra gondolni, hogy a jövő prediktív szövegrendszerei hogyan segíthetik az embereket sokkal hatékonyabb írókká válni, de átláthatóságra és elszámoltathatóságra is szükségünk van, hogy megvédhessük az esetlegesen elfogult vagy manipulált javaslatokat" - mondta Ken Arnold, a Harvard School of the School kutatója. Mérnöki és Alkalmazott Tudományok, akik részt vettek a tanulmányban, mondta a BBC.

Ha létezik mindenre kiterjedő megoldás a káros automatikus kiegészítés problémájára, azt még nem fedezték fel. A Google úgy döntött, hogy egyszerűen blokkolja a nemi alapú névmási javaslatokat a Smart Compose alkalmazásban, mert a rendszer rossz előrejelzőnek bizonyult a címzettek nemét és nemi identitását illetően. A Microsoft LinkedIn emellett elkerüli a nemek szerinti névmásokat a Smart Repliesben, prediktív üzenetküldő eszközében, hogy megelőzze az esetleges baklövést.

A Microsoft társszerzői tanulmány figyelmeztetnek arra, hogy ha a rendszertervezők nem foglalkoznak proaktívan az automatikus kiegészítési technológiák hiányosságaival, azzal a kockázattal járnak, hogy nemcsak megsértik a felhasználókat, hanem bizalmatlanságot is okoznak a rendszerekkel szemben. "A rendszertervezőknek meg kell vizsgálniuk a személyre szabási stratégiákat az egyén és a közösségi hálózatok szintjén, meg kell fontolniuk, hogy a kulturális értékeket és a társadalmi elfogultságokat miként tarthatják fenn rendszereik, és meg kell vizsgálniuk a társadalmi interakció modellezését, hogy elkezdjék kezelni a korlátokat és problémákat" - írták. „Eredményeink azt mutatják, hogy a jelenlegi szövegajánló rendszerek az e-mailekhez és más [hasonló] technológiákhoz továbbra sem elég árnyaltak ahhoz, hogy tükrözzék a valós társadalmi kapcsolatok és kommunikációs igények finomságait. "

VentureBeat

A VentureBeat küldetése, hogy digitális városi tér legyen a műszaki döntéshozók számára, ahol ismereteket szerezhetnek a transzformatív technológiáról és a tranzakciókról. Webhelyünk alapvető információkat tartalmaz az adattechnológiákról és -stratégiákról, amelyek útmutatást nyújtanak a szervezet vezetése során. Meghívjuk Önt, hogy legyen közösségünk tagja, hogy elérje:

  • naprakész információk az Ön számára érdekes témákról
  • hírlevelünk
  • zárt gondolat-vezető tartalom és kedvezményes hozzáférés díjazott eseményeinkhez, mint pl Átalakítás 2021: Tudj meg többet
  • hálózati funkciók és így tovább

Legyen tagja

Forrás: https://venturebeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

Időbélyeg:

Még több AI – VentureBeat