Matemaatikko astuu (väärän tiedon) baariin

Lähdesolmu: 1865101

Väärät tiedot, väärät tiedot, infotainment, alkusotat - jos viime vuosikymmenten keskustelu median tulevaisuudesta on merkinnyt jotain, ne ovat jättäneet ainakin pistävän jäljen englannin kieleen. Sosiaalisen median tekeminen meille on herättänyt paljon pelkoja ja pelkoja yksilöllisistä psykologioistamme ja neurologioistamme laajempaan huoleen demokraattisten yhteiskuntien vahvuudesta. Kuten Joseph Bernstein sanoi äskettäin, siirtyminen "väkijoukkojen viisaudesta" "desinformointiin" on todellakin ollut äkillinen.

Mitä on disinformaatio? Onko se olemassa ja jos on, missä se on ja mistä tiedämme, että katsomme sitä? Pitäisikö meidän välittää siitä, mitä suosikkialustojemme algoritmit näyttävät meille, kun ne pyrkivät puristamaan huomiomme luumuja? On vain sellaisia ​​monimutkaisia ​​matemaattisia ja yhteiskuntatieteellisiä kysymyksiä Nooa Giansiracusa kiinnostunut aiheesta.

Bostonin Bentleyn yliopiston professori Giansiracusa on koulutettu matematiikkaan (keskittyy tutkimukseensa algebrallisen geometrian kaltaisilla aloilla), mutta hänellä on myös taipumus tarkastella sosiaalisia aiheita matemaattisen linssin kautta, kuten yhdistämällä laskennallista geometriaa korkeimpaan oikeuteen. Viime aikoina hän julkaisi kirjan nimeltä "Kuinka algoritmit luovat ja estävät valeuutisia”Tutkia joitakin haastavia kysymyksiä mediaympäristössä nykyään ja miten tekniikka pahentaa ja parantaa näitä suuntauksia.

Isännöin Giansiracusaa Twitter -tilassa äskettäin, ja koska Twitter ei ole helpottanut näiden puheiden kuuntelemista jälkeenpäin (lyhytaikaisuus!), Ajattelin vetää esiin keskustelumme mielenkiintoisimmat palat sinulle ja jälkipolville.

Tätä haastattelua on muokattu ja tiivistetty selvyyden vuoksi.

Danny Crichton: Miten päätit tutkia valeuutisia ja kirjoittaa tämän kirjan?

Nooa Giansiracusa: Yksi asia, jonka huomasin, on paljon todella mielenkiintoista sosiologista, valtiotieteellistä keskustelua valeuutisista ja tämän tyyppisistä asioista. Ja sitten teknisellä puolella sinulla on asioita, kuten Mark Zuckerberg, joka sanoo, että tekoäly korjaa kaikki nämä ongelmat. Tuntui vain siltä, ​​että tätä kuilua on hieman vaikea täyttää.

Kaikki ovat luultavasti kuulleet tämän äskettäisen Bidenin lainauksen sanovan: "ne tappavat ihmisiä”Sosiaalisen median väärää tietoa koskien. Joten meillä on poliitikkoja puhumassa näistä asioista, joissa heidän on vaikea ymmärtää algoritmisia puolia. Sitten meillä on tietotekniikan ihmisiä, jotka ovat todella syviä yksityiskohtiin. Joten istun välillä, en ole todellinen hardcore -tietotekniikan henkilö. Joten luulen, että minun on hieman helpompi vain astua taaksepäin ja saada lintuperspektiivi.

Päivän lopussa minusta tuntui, että halusin vain tutkia lisää vuorovaikutusta yhteiskunnan kanssa, missä asiat menevät sekaisin, missä matematiikka ei ole niin puhdasta.

Crichton: Matemaattiselta taustalta tullessasi tulet tähän kiistanalaiseen alueeseen, jossa monet ihmiset ovat kirjoittaneet monista eri näkökulmista. Mitä ihmiset ovat oikeassa tällä alalla ja mitä ihmiset ovat ehkä jättäneet huomiotta jonkin vivahteen?

Giansiracusa: On paljon uskomatonta journalismia; Olin hämmästynyt siitä, kuinka monet toimittajat todella pystyivät käsittelemään melko teknisiä asioita. Mutta sanoisin yhden asian, että ehkä he eivät erehtyneet, mutta minulle tuli sellainen mieleen, että on monia kertoja, kun ilmestyy akateeminen artikkeli tai jopa ilmoitus Googlesta, Facebookista tai yhdestä näistä teknologiayrityksistä, ja he tavallaan mainitsevat jotain, ja toimittaja saattaa poimia lainauksen ja yrittää kuvata sitä, mutta he näyttävät hieman pelkäävän yrittää todella katsoa ja ymmärtää sitä. Ja en usko, että he eivät pystyneet siihen, se näyttää todellakin enemmän pelottelulta ja pelolta.

Yksi asia, jonka olen kokenut paljon matematiikan opettajana, on, että ihmiset pelkäävät sanoa jotain väärin ja tehdä virheen. Ja tämä koskee toimittajia, joiden on kirjoitettava teknisistä asioista, he eivät halua sanoa jotain väärin. Joten on helpompaa vain lainata lehdistötiedote Facebookista tai lainata asiantuntijaa.

Yksi asia, joka on niin hauskaa ja kaunista puhtaassa matematiikassa, on, ettet todellakaan huolehdi siitä, että olet väärässä, vaan vain kokeile ideoita ja katso, mihin ne johtavat, ja näet kaikki nämä vuorovaikutukset. Kun olet valmis kirjoittamaan paperia tai pitämään puheen, tarkistat yksityiskohdat. Mutta suurin osa matematiikasta on tämä luova prosessi, jossa tutkit ja näet vain kuinka ideat ovat vuorovaikutuksessa. Luuletko, että koulutukseni matemaatikkona saisi minut pelkäämään virheiden tekemistä ja erittäin tarkasti, mutta sillä oli tavallaan päinvastainen vaikutus.

Toiseksi, monet näistä algoritmisista asioista eivät ole niin monimutkaisia ​​kuin miltä ne näyttävät. En istu siellä niiden toteuttamisessa, olen varma, että niiden ohjelmointi on vaikeaa. Mutta vain kokonaiskuva, kaikki nämä algoritmit nykyään, niin suuri osa näistä asioista perustuu syvään oppimiseen. Joten sinulla on hermoverkko, minulle ulkopuolisena ei todellakaan ole väliä, mitä arkkitehtuuria he käyttävät, tärkeintä on vain se, mitkä ovat ennustajat? Periaatteessa mitkä ovat muuttujia, joita syötit tälle koneoppimisalgoritmille? Ja mitä se yrittää tulostaa? Ne ovat asioita, jotka kuka tahansa voi ymmärtää.

Crichton: Yksi suurimmista haasteista näiden algoritmien analysoinnissa on avoimuuden puute. Toisin kuin esimerkiksi puhdas matematiikka -maailma, joka on ongelmien ratkaisemiseen tähtäävän tutkijoiden yhteisö, monet näistä yrityksistä voivat itse asiassa olla varsin kiistanalaisia ​​tietojen ja analyysien toimittamisessa laajemmalle yhteisölle.

Giansiracusa: Näyttää siltä, ​​että on olemassa raja sille, mitä kuka tahansa voi päätellä vain olemalla ulkopuolelta.

Hyvä esimerkki on siis YouTubesta - tutkijoiden tiimit halusivat tutkia, lähettääkö YouTuben suositusalgoritmi ihmisiä alas näiden ääriliikkeiden salaliittoteorian kanien reikiin. Haasteena on, että koska tämä on suositusalgoritmi, se käyttää syvää oppimista, se perustuu satoihin ja satoihin ennustajiin, jotka perustuvat hakuhistoriaasi, väestötietoihisi, muihin katseltuihin videoihin ja kuinka kauan - kaikki nämä asiat. Se on niin räätälöity sinulle ja kokemuksellesi, että kaikki tutkimukset, jotka löysin, käyttävät incognito -tilaa.

Joten he ovat pohjimmiltaan käyttäjä, jolla ei ole hakuhistoriaa tai tietoja, ja he siirtyvät videoon ja napsauttavat sitten ensimmäistä suositeltua videota ja sitten seuraavaa. Ja katsotaanpa mihin algoritmi vie ihmiset. Se on niin erilainen kokemus kuin todellinen ihmiskäyttäjä, jolla on historia. Ja tämä on ollut todella vaikeaa. En usko, että kukaan on keksinyt hyvää tapaa tutkia algoritmisesti YouTube -algoritmia ulkopuolelta.

Rehellisesti sanottuna ainoa tapa, jolla luulen, että voisit tehdä sen, on vain sellainen kuin vanhan koulun tutkimus, jossa rekrytoit koko joukon vapaaehtoisia ja laitat seurannan tietokoneellesi ja sanot: ”Hei, vain elä elämääsi yleensä tehdä historiasi ja kaikki ja kerro meille videot, joita katselet. ” Joten on ollut vaikeaa ohittaa tämä tosiasia, että monet näistä algoritmeista, melkein kaikki, sanoisin, perustuvat niin voimakkaasti henkilökohtaisiin tietoihisi. Emme tiedä, miten tutkia sitä kokonaisuutena.

Eikä vain minulla tai kenelläkään muulla ulkopuolella ole ongelmia, koska meillä ei ole tietoja. Jopa näissä yrityksissä olevat ihmiset rakensivat algoritmin ja tietävät, miten algoritmi toimii paperilla, mutta he eivät tiedä, miten se todella käyttäytyy. Se on kuin Frankensteinin hirviö: he rakensivat tämän asian, mutta he eivät tiedä, miten se toimii. Joten ainoa tapa mielestäni voit todella tutkia sitä on, jos ihmiset, joilla on tietoja, menevät pois tieltä ja käyttävät aikaa ja resursseja sen tutkimiseen.

Crichton: Monia mittareita käytetään väärän tiedon arvioimiseen ja sitoutumisen määrittämiseen alustalla. Matemaattisesta taustastasi katsottuna ovatko nämä toimenpiteet mielestäsi vankat?

Giansiracusa: Ihmiset yrittävät kumota väärää tietoa. Mutta prosessissa he voivat kommentoida sitä, he voivat uudelleentwiittaa tai jakaa sen, ja tämä lasketaan sitoutumiseksi. Joten monet näistä sitoutumisen mittauksista, katsovatko he todella positiivista vai vain kaikkea sitoutumista? Tiedätkö, kaikki kootaan yhteen.

Tämä tapahtuu myös akateemisessa tutkimuksessa. Lainaukset ovat universaali mittari siitä, kuinka onnistunut tutkimus on. No, todella tekaistut asiat, kuten Wakefieldin alkuperäinen autismi- ja rokotepaperi, saivat tonnia viittauksia, monet heistä viittasivat siihen, koska he pitivät sitä oikeana, mutta suuri osa tiedemiehistä poisti sen, he viittaavat siihen paperissaan esimerkiksi osoitamme, että tämä teoria on väärä. Mutta jotenkin lainaus on viittaus. Joten kaikki otetaan huomioon menestysmittarissa.

Joten luulen, että se on vähän mitä tapahtuu sitoutumisen kanssa. Jos lähetän kommentteihini jotain sanomalla "Hei, se on hullua", miten algoritmi tietää, tuenko sitä vai en? He voisivat käyttää jotakin tekoälyn kieliprosessointia yrittääkseen, mutta en ole varma, ovatko ne, ja se on paljon vaivaa tehdä niin.

Crichton: Lopuksi haluan puhua hieman GPT-3: sta sekä synteettistä mediaa ja valeuutisia koskevasta huolesta. Pelätään paljon, että tekoälybotit hukuttavat median väärään tietoon - kuinka peloissaan tai ei peloissaan meidän pitäisi olla?

Giansiracusa: Koska kirjani kasvoi todella kokemuksesta, halusin yrittää pysyä puolueettomana ja vain kertoa ihmisille ja antaa heidän tehdä omat päätöksensä. Päätin katkaista tämän keskustelun ja antaa todella molempien osapuolten puhua. Uskon, että uutissyötealgoritmit ja tunnistusalgoritmit vahvistavat paljon haitallisia asioita, ja se on tuhoisaa yhteiskunnalle. Mutta on myös paljon hämmästyttävää edistystä algoritmien käyttämisessä tuottavasti ja onnistuneesti väärennettyjen uutisten rajoittamiseksi.

Siellä on näitä tekno-utopisteja, jotka sanovat, että tekoäly korjaa kaiken, meillä on totuuden kertomista, tosiasioiden tarkistamista ja algoritmeja, jotka voivat havaita väärää tietoa ja poistaa sen. Edistystä on jonkin verran, mutta sitä ei tapahdu, eikä se koskaan tule menestymään. Sen täytyy aina luottaa ihmisiin. Mutta toinen asia, joka meillä on, on eräänlainen irrationaalinen pelko. On olemassa tällainen hyperbolinen AI -dystopia, jossa algoritmit ovat niin tehokkaita, eräänlaisia ​​singulaarisuustyyppejä, että ne tuhoavat meidät.

Kun syvät väärennökset osuivat uutisiin ensimmäisen kerran vuonna 2018 ja GPT-3 oli julkaistu pari vuotta sitten, pelättiin paljon, että "Voi paska, tämä tekee kaikki ongelmamme valeuutisten kanssa ja ymmärtää, mikä on totta maailma paljon, paljon vaikeampi. " Ja mielestäni nyt, kun meillä on parin vuoden matka, voimme nähdä, että he ovat tehneet siitä hieman vaikeampaa, mutta eivät läheskään niin merkittävästi kuin odotimme. Ja pääkysymys on enemmän psykologinen ja taloudellinen kuin mikään.

Joten GPT-3: n alkuperäisillä kirjoittajilla on tutkimuspaperi, joka esittelee algoritmin, ja yksi heidän tekemistään asioista oli testi, jossa he liittivät jonkin tekstin ja laajensivat sen artikkeliksi, ja sitten he saivat joitain vapaaehtoisia arvioimaan ja arvaamaan, mikä on algoritmisesti luotu ja mikä artikkeli on ihmisen luoma. He kertoivat saavansa hyvin, hyvin lähellä 50% tarkkuutta, mikä tarkoittaa tuskin satunnaisia ​​arvauksia. Kuulostaa siis uskomattomalta ja pelottavalta.

Mutta jos tarkastelet yksityiskohtia, ne ulottuivat kuin yhden rivin otsikko tekstin kappaleeseen. Jos yritit tehdä täysimittaisen, Atlantin pituisen tai New Yorker-pituisen artikkelin, huomaat ristiriidat, ajatus menee mutkalle. Tämän artikkelin kirjoittajat eivät maininneet tätä, he vain tekivät kokeilunsa ja sanoivat: "Hei, katso kuinka onnistunut se on."

Joten se näyttää vakuuttavalta, he voivat tehdä nämä vaikuttavat artikkelit. Mutta tässä on tärkein syy päivän päätteeksi, miksi GPT-3 ei ole ollut niin muuttava väärennettyjen uutisten ja väärien tietojen ja kaiken tämän suhteen. Tämä johtuu siitä, että valeuutiset ovat enimmäkseen roskaa. Se on huonosti kirjoitettu, se on heikkolaatuista, se on niin halpaa ja nopeaa käynnistää, voit maksaa 16-vuotiaalle veljenpoikallesi vain, että hän vain käynnistää joukon väärennettyjä uutisia minuuteissa.

Ei ole niin paljon, että matematiikka auttoi minua näkemään tämän. Jotenkin vain tärkeintä, mitä yritämme tehdä matematiikassa, on olla skeptinen. Joten sinun on kyseenalaistettava nämä asiat ja oltava hieman skeptinen.

Lähde: https://techcrunch.com/2021/08/20/a-mathematician-walks-into-a-bar-of-disinformation/

Aikaleima:

Lisää aiheesta TechCrunch