En matematiker går ind i en bar (af desinformation)

Genudgivet af Platon

Abonnenter: 0

Desinformation, misinformation, infotainment, algowars - hvis debatterne om mediernes fremtid de sidste par årtier har betydet noget, har de i det mindste sat et skarpt aftryk på det engelske sprog. Der har været en masse skænderier og frygt over, hvad sociale medier gør ved os, fra vores individuelle psykologi og neurologi til bredere bekymringer om styrken af demokratiske samfund. Som Joseph Bernstein udtrykte det for nylig, har skiftet fra "massernes visdom" til "desinformation" faktisk været et brat et.

Hvad er desinformation? Findes den, og hvis ja, hvor er den, og hvordan ved vi, at vi ser på den? Skal vi bekymre os om, hvad algoritmerne på vores yndlingsplatforme viser os, når de stræber efter at presse vores opmærksomhed? Det er netop den slags indviklede matematiske og samfundsvidenskabelige spørgsmål, der fik Noah Giansiracusa interesseret i emnet.

Giansiracusa, professor ved Bentley University i Boston, er uddannet i matematik (med fokus på sin forskning inden for områder som algebraisk geometri), men han har også haft en forkærlighed for at se på sociale emner gennem en matematisk linse, såsom at forbinde beregningsgeometri til Højesteret. Senest har han udgivet en bog kaldet "Hvordan algoritmer opretter og forhindrer falske nyheder” for at udforske nogle af de udfordrende spørgsmål omkring medielandskabet i dag, og hvordan teknologien forværrer og forbedrer disse tendenser.

Jeg var vært for Giansiracusa på et Twitter-rum for nylig, og da Twitter ikke har gjort det let at lytte til disse foredrag bagefter (flyktighed!), regnede jeg med, at jeg ville trække de mest interessante dele af vores samtale frem for dig og eftertiden.

Dette interview er redigeret og kondenseret for klarhed.

Danny Crichton: Hvordan besluttede du dig for at undersøge falske nyheder og skrive denne bog?

Noah Giansiracusa: En ting, jeg lagde mærke til, er, at der er en masse interessant sociologisk, statsvidenskabelig diskussion om falske nyheder og den slags ting. Og så på den tekniske side vil du have ting som Mark Zuckerberg, der siger, at AI vil løse alle disse problemer. Det virkede bare som om, det er lidt svært at bygge bro over det kløft.

Alle har sikkert hørt dette nylige citat af Biden sige, "de dræber folk", i forhold til misinformation på sociale medier. Så vi har politikere, der taler om disse ting, hvor det er svært for dem virkelig at forstå den algoritmiske side. Så har vi datamatikere, der er virkelig dybt i detaljerne. Så jeg sidder lidt imellem, jeg er ikke en rigtig hardcore datalogi-person. Så jeg tror, det er lidt nemmere for mig bare at træde tilbage og få et fugleperspektiv.

I slutningen af dagen følte jeg bare, at jeg gerne ville udforske nogle flere interaktioner med samfundet, hvor tingene bliver rodet, hvor matematikken ikke er så ren.

Crichton: Når du kommer fra en matematisk baggrund, går du ind i dette omstridte område, hvor mange mennesker har skrevet fra mange forskellige vinkler. Hvad gør folk rigtigt på dette område, og hvad har folk måske savnet nogle nuancer?

Giansiracusa: Der er en masse utrolig journalistik; Jeg var blæst bagover over, hvor mange journalister virkelig var i stand til at håndtere ret tekniske ting. Men jeg vil sige én ting, som de måske ikke tog fejl, men det slog mig, at der er mange gange, hvor der kommer en akademisk afhandling, eller endda en meddelelse fra Google eller Facebook eller en af disse teknologivirksomheder, og de vil på en måde nævne noget, og journalisten vil måske uddrage et citat og prøve at beskrive det, men de virker en smule bange for virkelig at prøve at se og forstå det. Og jeg tror ikke, det er, at de ikke var i stand til det, det virker virkelig som mere en intimidering og en frygt.

En ting, jeg har oplevet meget som matematiklærer, er, at folk er så bange for at sige noget forkert og begå en fejl. Og det gælder journalister, der skal skrive om tekniske ting, de vil ikke sige noget forkert. Så det er nemmere bare at citere en pressemeddelelse fra Facebook eller citere en ekspert.

En ting, der er så sjov og smuk ved ren matematik, er, at du ikke rigtig bekymrer dig om at tage fejl, du prøver bare ideer og ser, hvor de fører hen, og du ser alle disse interaktioner. Når du er klar til at skrive en opgave eller holde en tale, tjekker du detaljerne. Men det meste af matematik er denne kreative proces, hvor du udforsker, og du bare ser, hvordan ideer interagerer. Min uddannelse som matematiker tror du ville gøre mig bange for at lave fejl og for at være meget præcis, men det havde lidt den modsatte effekt.

For det andet, mange af disse algoritmiske ting, de er ikke så komplicerede, som de ser ud til. Jeg sidder ikke og implementerer dem, jeg er sikker på at det er svært at programmere dem. Men bare det store billede, alle disse algoritmer i dag, så meget af disse ting er baseret på dyb læring. Så du har et eller andet neuralt net, det betyder ikke rigtig noget for mig som outsider, hvilken arkitektur de bruger, det eneste, der virkelig betyder noget, er, hvad er forudsigelserne? Dybest set, hvad er de variabler, du fodrer med denne maskinlæringsalgoritme? Og hvad forsøger den at udsende? Det er ting, som enhver kan forstå.

Crichton: En af de store udfordringer, jeg tænker på ved at analysere disse algoritmer, er manglen på gennemsigtighed. I modsætning til for eksempel den rene matematikverden, som er et fællesskab af forskere, der arbejder på at løse problemer, kan mange af disse virksomheder faktisk være ret modstridende med hensyn til at levere data og analyser til det bredere samfund.

Giansiracusa: Det ser ud til, at der er en grænse for, hvad nogen kan udlede, bare ved at være udefra.

Så et godt eksempel er med YouTube - hold af akademikere ønskede at undersøge, om YouTube-anbefalingsalgoritmen sender folk ned i disse konspirationsteori-kaninhuller af ekstremisme. Udfordringen er, at fordi dette er anbefalingsalgoritmen, bruger den dyb læring, den er baseret på hundreder og hundreder af forudsigelser baseret på din søgehistorik, din demografi, de andre videoer, du har set og hvor længe - alle disse ting. Det er så tilpasset dig og din oplevelse, at alle de undersøgelser, jeg kunne finde, bruger inkognitotilstand.

Så de er dybest set en bruger, der ikke har nogen søgehistorik, ingen information, og de vil gå til en video og derefter klikke på den første anbefalede video og derefter den næste. Og lad os se, hvor algoritmen fører folk hen. Det er sådan en anderledes oplevelse end en faktisk menneskelig bruger med en historie. Og det har været rigtig svært. Jeg tror ikke, at nogen har fundet ud af en god måde at algoritmisk udforske YouTube-algoritmen udefra.

Helt ærligt, den eneste måde, jeg tror, du kan gøre det på, er ligesom en gammeldags undersøgelse, hvor du rekrutterer en hel flok frivillige og på en måde sætter en tracker på deres computer og siger, "Hey, bare lev livet, som du gør normalt med din historie og alt og fortæl os de videoer, du ser." Så det har været svært at komme forbi dette faktum, at mange af disse algoritmer, næsten alle, vil jeg sige, er så stærkt baseret på dine individuelle data. Vi ved ikke, hvordan vi skal studere det samlet.

Og det er ikke kun mig eller nogen andre udefra, der har problemer, fordi vi ikke har dataene. Det er endda folk inden for disse virksomheder, der har bygget algoritmen, og som ved, hvordan algoritmen fungerer på papiret, men de ved ikke, hvordan den rent faktisk kommer til at opføre sig. Det er ligesom Frankensteins monster: de byggede denne ting, men de ved ikke, hvordan det kommer til at fungere. Så den eneste måde, jeg tror, du virkelig kan studere det på, er, hvis folk på indersiden med disse data går af vejen og bruger tid og ressourcer på at studere dem.

Crichton: Der er mange målinger, der bruges omkring evaluering af misinformation og bestemmelse af engagement på en platform. Kommer du fra din matematiske baggrund, tror du, at disse mål er robuste?

Giansiracusa: Folk forsøger at afkræfte misinformation. Men i processen kan de kommentere det, de kan retweete det eller dele det, og det tæller som engagement. Så mange af disse målinger af engagement, ser de virkelig på positivt eller kun alt engagement? Du ved, det hele klumpes sammen.

Dette sker også i akademisk forskning. Citater er den universelle målestok for, hvor succesfuld forskning er. Tja, virkelig falske ting som Wakefields originale autisme- og vaccinepapir fik tonsvis af citater, mange af dem var folk, der citerede det, fordi de troede, det var rigtigt, men mange af det var videnskabsmænd, der afslørede det, de citerer det i deres papir for at sige, vi demonstrerer, at denne teori er forkert. Men på en eller anden måde er et citat et citat. Så det hele tæller med i succesmålingen.

Så jeg tror, det er lidt af det, der sker med engagement. Hvis jeg skriver noget i mine kommentarer, hvor der står "Hey, det er vanvittigt", hvordan ved algoritmen, om jeg støtter det eller ej? De kunne bruge noget AI-sprogbehandling til at prøve, men jeg er ikke sikker på, om de er det, og det er en stor indsats at gøre det.

Crichton: Til sidst vil jeg tale lidt om GPT-3 og bekymringen omkring syntetiske medier og falske nyheder. Der er stor frygt for, at AI-bots vil overvælde medier med desinformation - hvor bange eller ikke bange skal vi være?

Giansiracusa: Fordi min bog virkelig voksede ud af en klasse af erfaring, ville jeg prøve at forblive upartisk og bare på en måde informere folk og lade dem træffe deres egne beslutninger. Jeg besluttede at prøve at skære igennem den debat og virkelig lade begge sider tale. Jeg tror, at nyhedsfeedalgoritmerne og genkendelsesalgoritmerne forstærker en masse skadelige ting, og det er ødelæggende for samfundet. Men der er også en masse fantastiske fremskridt med at bruge algoritmer produktivt og med succes til at begrænse falske nyheder.

Der er disse tekno-utopister, som siger, at AI vil rette alt, vi vil have sandhedsfortælling og faktatjek og algoritmer, der kan opdage misinformation og fjerne den. Der er nogle fremskridt, men det kommer ikke til at ske, og det vil aldrig lykkes fuldt ud. Det bliver altid nødvendigt at stole på mennesker. Men den anden ting, vi har, er en slags irrationel frygt. Der er denne form for hyperbolsk AI-dystopi, hvor algoritmer er så kraftfulde, en slags singularitetstyper, at de vil ødelægge os.

Da dybe forfalskninger først ramte nyhederne i 2018, og GPT-3 var blevet frigivet for et par år siden, var der stor frygt for, "Åh shit, det her vil gøre alle vores problemer med falske nyheder og forstå, hvad der er sandt i verden meget, meget sværere." Og jeg tror, at nu, hvor vi har et par års afstand, kan vi se, at de har gjort det lidt sværere, men ikke nær så markant, som vi forventede. Og hovedspørgsmålet er lidt mere psykologisk og økonomisk end noget andet.

Så de oprindelige forfattere af GPT-3 har et forskningspapir, der introducerer algoritmen, og en af de ting, de gjorde, var en test, hvor de indsatte noget tekst og udvidede det til en artikel, og så fik de nogle frivillige til at vurdere og gætte, hvilken er den algoritmisk genererede, og hvilken artikel er den menneskeskabte. De rapporterede, at de fik meget, meget tæt på 50% nøjagtighed, hvilket betyder knapt over tilfældige gæt. Så det lyder, du ved, både fantastisk og skræmmende.

Men hvis du ser på detaljerne, strækker de sig som en overskrift på én linje til et tekstafsnit. Hvis du prøvede at lave en hel artikel i The Atlantic-længde eller New Yorker-længde, vil du begynde at se uoverensstemmelserne, tanken kommer til at slynge sig. Forfatterne af dette papir nævnte ikke dette, de gjorde bare deres eksperiment og sagde: "Hey, se hvor vellykket det er."

Så det ser overbevisende ud, de kan lave disse imponerende artikler. Men her er hovedårsagen, i sidste ende, hvorfor GPT-3 ikke har været så transformativ, hvad angår falske nyheder og misinformation og alt det her. Det er fordi falske nyheder for det meste er skrald. Det er dårligt skrevet, det er af lav kvalitet, det er så billigt og hurtigt at slå ud, du kan bare betale din 16-årige nevø for bare at skrive en masse falske nyhedsartikler ud på få minutter.

Det er ikke så meget, at matematik hjalp mig med at se dette. Det er bare på en eller anden måde, at det vigtigste, vi forsøger at gøre i matematik, er at være skeptiske. Så du skal stille spørgsmålstegn ved disse ting og være lidt skeptisk.

Kilde: https://techcrunch.com/2021/08/20/a-mathematician-walks-into-a-bar-of-disinformation/

Tidsstempel: August 20, 2021

Tidsstempel: Jan 12, 2022

Finansiel concierge-startup Zeni banker $34M for at vise SMB'er deres økonomi i realtid

Kildeklynge:

TechCrunch

Kildeknude: 1859384

Tidsstempel: August 4, 2021

Genudgivet af Platon

Breinify annoncerer $11M frø til at bringe datavidenskab til marketingteamet

Metaforskere bygger en AI, der lærer lige så godt fra visuelle, skrevne eller talte materialer

Applied XL indsamler $1.5 mio. til at bygge 'redaktionelle algoritmer', der sporer realtidsdata

For at løse alle de små ting, se til hverdagens Lille AI

Zingtree gør komplekse kundeserviceprocesser til klare handlingsplaner

Fleksy hæver Series A for at udvide sin tastatur SDK-biz efter 10x vækst

Shelf.io lukker enorme $52.5M Series B efter at have postet 4x ARR-vækst i det sidste år

Tailor Brands indsamler 50 millioner dollars og sigter mod at være one-stop-shop for små virksomheder at lancere

BigPanda får sit horn efter at have sikret sig 190 millioner dollars i frisk kapital

Finansiel concierge-startup Zeni banker $34M for at vise SMB'er deres økonomi i realtid

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto