Google frigjør en smart ML-bildekomprimeringsmodell ... men den er for JPEG-XL

Kilde node: 1765805

En ny applikasjon av maskinlæring ser både smart og hendig ut, i motsetning til de mer normale egenskapene ved å være et sted mellom personvern-, opphavsrett- eller livsfarlig. Men før du blir for spent, kan du ikke ha det.

Den sanne kostnaden for ML-applikasjoner varierer. Mange er gratis å bruke, noe som betyr at de setter den betalte inntekten til noen i fare et sted. Talegjenkjenning setter fattige mennesker inn kundesentre uten jobb. "AI" bildegeneratorer frata kreative kunstnere inntektene deres, og "AI" tekstgeneratorer true forfattere - i de få jobbene som overlevde nettet og ødela den trykte journalistikken, uansett.

Å bruke ML på bildekomprimering og dekompresjon virker som en relativt sikker bruk. Å legge til mer smart til bildekomprimering har føltes som om det var en inspirert idé som ventet på sitt øyeblikk siden den gang Michael Barnsley oppfunnet fraktal bildekomprimering i 1987.

Den nye oppmerksomhetssentermodell gjør noe annerledes: Den bruker maskinlæring for å forsøke å identifisere hvilke deler av et bilde som vil tiltrekke et menneskes oppmerksomhet først, slik at det selektivt kan dekomprimere disse regionene først.

Last inn de viktige bitene først

Hvis du er gammel nok til å huske å se GIF-bilder gradvis dukke opp, linje for linje, mens de lastes ned over et oppringt modem, vil du umiddelbart forstå anken. Men nå handler det mer om mobile og trådløse tilkoblinger, hvis hastighet ikke bare varierer voldsomt, men uforutsigbart.

Tanken er at en lavoppløselig versjon av hele bildet vises rett i starten, og når den visuelle cortexen din har bestemt seg for hvor du skal peke pupillene dine, blir dette området av bildet allerede skarpere. Så mens oppmerksomheten din streifer rundt i bildet, har algoritmen gjettet hvor øynene dine vil gå videre og fyller ut mer detaljer i de bitene neste. Når disse delene er ganske skarpe, så er resten fylt ut, de relativt kjedelige bitene sist av alle.

Hvis det fungerte bra nok, ville du sannsynligvis ikke engang lagt merke til at det skjedde. Illusjonen ville være at en perfekt skarp versjon dukket opp rett i starten. Vi anbefaler å leke med denne demonstrasjon, så lenge du har en Chrome-basert nettleser og du aktiverer dens eksperimentelle JPEG-XL bildegjengivelse: gå til chrome://flags, søk etter jxl og aktiver den.

Algoritmen er beskrevet i et innlegg med tittelen «Open sourcing oppmerksomhetssentermodellen» på Googles åpen kildekode-blogg ... og der ligger ironien, og det er grunnen til at det foregående avsnittet brukte den betingede modusen. Fordi denne funksjonen bruker den nye JPEG-XL bildeformat – det som Google sa at det ville fjerne fra fremtidige versjoner av Chrome tilbake i oktober.

Det ville være uberettiget og uforsvarlig kynisk av oss å foreslå at fordi formatet skal fjernes fra Chrome 110, er det derfor Google er villig til å åpne kildekode for teknologien, så vi vil ikke. ®

Tidstempel:

Mer fra Registeret