AI-drevet kreativitet gir overveldede PC-er noe verdt å gjøre, endelig

Kilde node: 1729591

Kolonne Inntil nylig så det ut til at maskinvare for personlig datamaskin har hoppet forbi alle krav som programvare kunne stille til den. Til og med avanserte spill – som tradisjonelt sett er i forkant av brukerkrav til ytelse – beskattet knapt det massivt overveldede, toppklasses silisiumet som er tilgjengelig. Så kom AI-kunsten.

Apples M1 Ultra-mikroprosessor har et transistorantall nord for 100 milliarder. Nvidia har nettopp sluppet den flaggskip RTX 4090 GPU, med 76 milliarder transistorer – en tredobling i forhold til forrige generasjon, produktet av den siste prosessnoden, og en fandenivoldsk holdning til strømforbruk. Nesten 500W TDP? Skru den opp og varm opp hjemmet i vinter.

Men til hvilket formål? En 300 fps Fortnite Battle Royale? I April Jeg skrev: "Disse monstrene må temmes, trenes og settes i arbeid." Teknologi avskyr et vakuum – fire tiår i feltet har lært meg det. Der det er kapasitet, vil det komme noe for å bruke den.

Den andre skoen falt i begynnelsen av september, da HuggingFace AI – et privat firma som lager programvareverktøy som utnytter banebrytende kunstig intelligens-teknikker – lansert Stabil diffusjon.

Ligner på systemer som DALL•E og midt på reisen, Stable Diffusion luftes opp og reduserer deretter milliarder av bilder til symbolsk vektede tokens som kan trylles tilbake til synlighet med en passende utformet tekstmelding. Det hele sitter bare på denne siden av hekseri - men det fungerer bemerkelsesverdig bra.

I motsetning til DALL•E eller Midjourney, er Stable Diffusion både fullstendig selvforsynt – i stand til å kjøre på hvilken som helst kraftig nok maskin – og ren FOSS. Dette betydde at selv om den første utgivelsen krevde noen av Nvidias høyeste GPU-er, hadde prosjektbidragsytere innen en uke fjernet koden og reduserte maskinvarekravene. Den nåværende versjonen kan kjøre ganske komfortabelt på den kraftige PC-en jeg kjøpte for seks år siden for å utforske den nylig gjenfødte verden av virtuell virkelighet – så vel som på stort sett hvilken som helst M1-basert Mac. Mange spill-PCer og bærbare datamaskiner kan kjøre Stable Diffusion godt nok til å bruke den til prosjektbaserte kreative behov – eller bare for moro skyld.

Så en gruppe forskere publisert et papir på noe de kalte Dreamfusion – i stand til å trylle frem en uendelig serie med fullt realiserte 3D-modeller fra tekstmeldinger. Skriv inn pineapple, og datamaskinen vil tenke, og deretter generere sin beste tilnærming til hvordan den modellen skal se ut. Selv om den gruppen ennå ikke har gitt ut koden sin, ga papiret nok en blåkopi til at en ambisiøs koder kan tilpasse den stabile diffusjonskodebasen for å lage Stabil Dreamfusion – som igjen krever ganske kraftig maskinvare.

Et bilde produsert av Stable Diffusion fra tekstmeldingen 'En robot som maler et bilde mens du løper på en tredemølle' … Klikk for å forstørre

For ikke å overgås, en annen gruppe ved Tel Aviv University forbløffet verden med Menneskelig bevegelsesdiffusjonsmodell. Denne artikkelen viste hvordan forskere hadde brukt diffusjonsbaserte AI-teknikker for å konvertere en melding som "the person walks forward two steps and does a cartwheel" til en humaniform animasjon. En uke senere, forskerne selv ga ut koden sin som FOSS.

Vi er fortsatt litt tidlig ute med denne eksponentielle veksten i AI-evner for å vite hvor noe av det vil føre. Både Canva og Microsoft har allerede integrert promptbaserte bildegeneratorer i sine kreative verktøy. Meta, Google, og andre har demonstrert proprietære prompt-til-video-generatorer. På dagens trend trenger vi ikke å vente lenge før vi har FOSS-ekvivalenter å leke med.

Den visuelle kunsten har kraftige nye verktøy som ikke er det eksklusive domenet til giganter som Google eller OpenAI – sistnevnte et firma som lovet å demokratisere AI ved grunnlaget, men perverst ser ut til å ha fokusert på å skape sitt eget proprietære imperium med Microsoft som sitt uoffisiell eier.

I en av mine første spalter for Registeret jeg pekte på slutten av den endeløse oppgraderingssyklusen for PC-er. Ikke mer tredemølle: bra nok, de ville bare bli byttet ut når de ble utslitt. Med unntak av en rekke oppgraderinger for å imøtekomme pandemi-drevet videokonferanse den spådommen har vist seg riktig.

Men den personlige datamaskinen har mistet huden sin og avslørt sin glatte nye form som en kreativ superdatamaskin: Diffusjonsdrevet og kreativt kapabel på måter den gamle PC-en ikke kunne begynne å nærme seg. I stedet for å tilby en ny pekepenn eller pensel, danner disse kvalitativt forskjellige verktøyene en ny form for kreativt partnerskap.

I juni kjøpte jeg en bærbar PC med høy spesifikasjon – og følte meg umiddelbart skyldig for det, og tenkte at jeg aldri hadde fått den til å fungere. I dag utnytter jeg til fulle en maskin som kan gjøre både det siste og det utrolige. I ettertid ser det kjøpet ut som et smart røverkjøp – en varsler om en ekte renessanse – når PC-en, gjenfødt, begynner å fungere. ®

Tidstempel:

Mer fra Registeret