AI-drevet kreativitet giver endelig overmandede pc'er noget værd at gøre

Kildeknude: 1729591

Kolonne Indtil for nylig så personlig computerhardware ud til at være sprunget forbi alle krav, software kunne stille til den. Selv avancerede spil – traditionelt førende inden for brugerkrav til ydeevne – beskattede knap det massivt overmandede, top-end silicium tilgængeligt. Så kom kunstig intelligens.

Apples M1 Ultra-mikroprocessor har et transistorantal nord for 100 mia. Nvidia har netop udgivet sin flagskib RTX 4090 GPU, med 76 milliarder transistorer – en tredobling i forhold til den forrige generation, produktet af den seneste procesknude og en fandenivoldsk holdning til strømforbrug. Næsten 500W TDP? Skru den op og opvarm dit hjem denne vinter.

Men til hvilket formål? En 300fps Fortnite Battle Royale? I april Jeg skrev: "Disse monstre skal tæmmes, trænes og sættes på arbejde." Teknologien afskyr et vakuum – det har fire årtier på området lært mig. Hvor der er kapacitet, vil der komme noget til at bruge den.

Den anden sko faldt i begyndelsen af ​​september, da HuggingFace AI – et privat firma, der skaber softwareværktøjer, der udnytter banebrydende kunstig intelligens-teknikker – frigivet Stabil diffusion.

Svarende til systemer som DALL•E og midt på rejsen, Stable Diffusion hoovers op og reducerer derefter milliarder af billeder til symbolsk vægtede tokens, der kan trylles tilbage til synlighed med en passende udformet tekstprompt. Det hele sidder bare på denne side af hekseri - alligevel fungerer det bemærkelsesværdigt godt.

I modsætning til DALL•E eller Midjourney er Stable Diffusion både fuldstændig selvstændig – i stand til at køre på enhver kraftig nok maskine – og ren FOSS. Dette betød, at selvom den oprindelige udgivelse krævede nogle af Nvidias højeste GPU'er, havde projektbidragydere inden for en uge fjernet dens kode og reducerede dets hardwarekrav. Den nuværende version kan køre ganske komfortabelt på den kraftige pc, jeg købte for seks år siden for at udforske den nyfødte verden af ​​virtual reality – såvel som på stort set enhver M1-baseret Mac. Mange gaming-pc'er og bærbare computere kan køre Stable Diffusion godt nok til at bruge det til projektbaserede kreative behov - eller bare for sjov.

Derefter en gruppe forskere udgivet et papir på noget, de kaldte Dreamfusion - i stand til at fremtrylle en uendelig række af fuldt realiserede 3D-modeller fra tekstprompter. Indtaste pineapple, og computeren vil tænke, og derefter generere sin bedste tilnærmelse af, hvordan denne model skal se ud. Selvom denne gruppe endnu ikke har frigivet sin kode, gav papiret et tilstrækkeligt plan til, at en ambitiøs koder kunne tilpasse den stabile diffusionskodebase til at skabe Stabil Dreamfusion – hvilket igen kræver ret kraftig hardware.

Et billede produceret af Stable Diffusion fra tekstprompten 'En robot, der maler et billede, mens han løber på et løbebånd' … Klik for at forstørre

For ikke at blive overgået, forbløffede en anden gruppe ved Tel Aviv Universitet verden med Human Motion Diffusion Model. Dette papir viste, hvordan forskere havde brugt diffusionsbaserede AI-teknikker til at konvertere en prompt som "the person walks forward two steps and does a cartwheel” til en humaniform animation. En uge senere forskerne selv frigivet deres kode som FOSS.

Vi er stadig lidt tidligt i denne eksponentielle vækst i AI-kapaciteter for at vide, hvor noget af det vil føre hen. Både Canva og Microsoft har allerede integreret prompt-baserede billedgeneratorer i deres kreative værktøjer. Meta, Google, og andre har demonstreret proprietære prompt-to-video-generatorer. I den nuværende trend skal vi ikke vente længe, ​​før vi har FOSS-ækvivalenter at spille med.

Billedkunsten har kraftfulde nye værktøjer, der ikke er det eksklusive domæne for giganter som Google eller OpenAI – sidstnævnte et firma, der lovede at demokratisere AI ved sin grundlæggelse, men perverst ser ud til at have fokuseret på at skabe sit eget proprietære imperium med Microsoft som sin uofficiel ejer.

I en af ​​mine første klummer for Registret jeg pegede på enden af den endeløse opgraderingscyklus til pc'er. Ikke mere løbebånd: godt nok, de ville kun blive udskiftet, når de er slidte. Med undtagelse af en byge af opgraderinger til at rumme pandemi-drevet videokonference den forudsigelse har vist sig at være rigtig.

Men den personlige computer har fældet sig og afsløret sin glatte nye form som en kreativ supercomputer: Diffusionsdrevet og kreativt dygtig på måder, som den gamle pc ikke kunne begynde at nærme sig. I stedet for at tilbyde endnu en ny stylus eller pensel, danner disse kvalitativt forskellige værktøjer en ny form for kreativt partnerskab.

I juni købte jeg en high-spec pc-bærbar computer – og følte mig straks skyldig over den, og troede, at jeg aldrig rigtig ville få den til at fungere. I dag benytter jeg mig fuldt ud af en maskine, der kan gøre både det daglige og det utrolige. Set i bakspejlet ser det køb ud som en smart handel – et bud på en sand renæssance – da pc'en, genfødt, kommer til at fungere. ®

Tidsstempel:

Mere fra Registret