AI-gedreven creativiteit geeft overbelaste pc's eindelijk iets dat de moeite waard is om te doen

Bronknooppunt: 1729591

Kolom Tot voor kort leek personal computerhardware alle eisen die software eraan zou kunnen stellen te overtreffen. Zelfs high-end games - traditioneel de voorhoede van gebruikerseisen op het gebied van prestaties - belastten nauwelijks het enorm overweldigde, hoogwaardige silicium dat beschikbaar is. Toen kwam AI-kunst langs.

Apple's M1 Ultra-microprocessor heeft een transistortelling ten noorden van 100 miljard. Nvidia heeft zojuist zijn . vrijgegeven vlaggenschip RTX 4090 GPU, met 76 miljard transistors - een drievoudige toename ten opzichte van de vorige generatie, het product van het nieuwste procesknooppunt en een duivelse houding ten opzichte van stroomverbruik. Bijna 500W TDP? Zet 'm op en verwarm je huis deze winter.

Maar met welk doel? Een 300fps Fortnite Battle Royale? In april Ik schreef: "Deze monsters moeten getemd, getraind en aan het werk worden gezet." Technologie verafschuwt een vacuüm - vier decennia in het veld hebben me dat geleerd. Waar capaciteit is, komt er iets om het in te zetten.

Die andere schoen viel begin september, toen... KnuffelenGezicht AI – een particulier bedrijf dat softwaretools maakt die gebruikmaken van geavanceerde kunstmatige-intelligentietechnieken – vrijgegeven Stabiele diffusie.

Vergelijkbaar met systemen zoals DALL•E en halverwege de reis, Stable Diffusion stofzuigt omhoog en reduceert vervolgens miljarden afbeeldingen tot symbolisch gewogen tokens die weer zichtbaar kunnen worden gemaakt met een correct vervaardigde tekstprompt. Het hele ding zit net aan deze kant van hekserij - maar het werkt opmerkelijk goed.

In tegenstelling tot DALL•E of Midjourney is Stable Diffusion zowel volledig op zichzelf staand – in staat om op elke krachtig genoeg machine te draaien – als pure FOSS. Dit betekende dat hoewel voor de eerste release enkele van de allerbeste GPU's van Nvidia nodig waren, de projectmedewerkers binnen een week ontdaan van de code en verminderde de hardwarevereisten. De huidige versie kan redelijk comfortabel draaien op de stevige pc die ik zes jaar geleden kocht om de nieuw herboren wereld van virtual reality te verkennen - evenals op vrijwel elke M1-gebaseerde Mac. Veel gaming-pc's en laptops kunnen Stable Diffusion goed genoeg draaien om het te gebruiken voor projectmatige creatieve behoeften - of gewoon voor de lol.

Dan een groep onderzoekers een paper gepubliceerd op iets dat ze Dreamfusion noemden - in staat om een ​​oneindige reeks volledig gerealiseerde 3D-modellen op te roepen uit tekstprompts. Typ in pineapple, en de computer zal nadenken en vervolgens de beste benadering genereren van hoe dat model eruit zou moeten zien. Hoewel die groep zijn code nog niet heeft vrijgegeven, bood het papier voldoende blauwdruk voor een ambitieuze codeur om de Stable Diffusion-codebase aan te passen om te creëren Stabiele droomfusie - wat, nogmaals, redelijk krachtige hardware vereist.

Een afbeelding geproduceerd door Stable Diffusion uit de tekstprompt 'Een robot die een afbeelding schildert terwijl hij op een loopband rent' … Klik om te vergroten

Om niet achter te blijven, verbaasde een andere groep aan de Universiteit van Tel Aviv de wereld met de Menselijk bewegingsdiffusiemodel. Dit artikel liet zien hoe onderzoekers op diffusie gebaseerde AI-technieken hadden gebruikt om een ​​prompt als "the person walks forward two steps and does a cartwheel” in een menselijke animatie. Een week later, de onderzoekers zelf hebben hun code vrijgegeven als FOSS.

We zijn nog een beetje vroeg in deze exponentiële groei van AI-mogelijkheden om te weten waar dit toe zal leiden. Zowel Canva als Microsoft hebben al op prompts gebaseerde afbeeldingsgeneratoren geïntegreerd in hun creatieve tools. meta, Kopen Google Reviews, en anderen hebben gepatenteerde prompt-to-video generatoren gedemonstreerd. Volgens de huidige trend hoeven we niet lang te wachten tot we FOSS-equivalenten hebben om mee te spelen.

De beeldende kunst heeft krachtige nieuwe tools die niet het exclusieve domein zijn van reuzen als Google of OpenAI - de laatste een bedrijf dat beloofde AI bij de oprichting te democratiseren, maar pervers lijkt te hebben gefocust op het creëren van zijn eigen propriëtaire imperium met Microsoft als zijn onofficiële eigenaar.

In een van mijn eerste columns voor Het register ik wees naar Eind van de eindeloze upgradecyclus voor pc's. Geen loopband meer: ​​goed genoeg, ze zouden alleen worden vervangen als ze versleten waren. Met uitzondering van een reeks upgrades om tegemoet te komen pandemie-gedreven videoconferenties die voorspelling is juist gebleken.

Maar de personal computer heeft zijn huid afgeworpen en onthult zijn gelikte nieuwe vorm als een creatieve supercomputer: door diffusie aangedreven en creatief in staat op manieren die de oude pc niet kon benaderen. In plaats van nog een nieuwe stylus of penseel aan te bieden, smeden deze kwalitatief verschillende tools een nieuw soort creatief partnerschap.

In juni kocht ik een high-spec pc-laptop – en voelde me er meteen schuldig voor, denkend dat ik hem nooit echt aan het werk zou krijgen. Tegenwoordig maak ik volledig gebruik van een machine die zowel het alledaagse als het ongelooflijke kan. Achteraf gezien lijkt die aankoop een slim koopje - een voorbode van een echte renaissance - als de herboren pc aan het werk gaat. ®

Tijdstempel:

Meer van Het register