Creativitatea bazată pe inteligență artificială oferă computerelor supraputernice ceva ce merită să facă, în sfârșit

Nodul sursă: 1729591

Coloană Până de curând, hardware-ul computerelor personale părea să fi depășit orice cerințe pe care software-ul i-ar putea impune. Chiar și jocurile de ultimă generație – în mod tradițional vârful de vârf al cerințelor utilizatorilor în ceea ce privește performanța – abia dacă au taxat siliciul de vârf, extrem de copleșit, disponibil. Apoi a apărut arta AI.

Microprocesorul M1 Ultra de la Apple are un număr de tranzistori la nord de 100 de miliarde. Nvidia tocmai l-a lansat GPU emblematic RTX 4090, cu 76 de miliarde de tranzistori – o creștere de trei ori față de generația anterioară, produsul celui mai recent nod de proces și o atitudine de diavol-poate față de consumul de energie. Aproape 500 W TDP? Porniți-l și încălziți-vă casa în această iarnă.

Dar cu ce scop? Un Fortnite Battle Royale de 300 fps? In aprilie I-am scris: „Acești monștri trebuie să fie îmblânziți, antrenați și puși la lucru.” Tehnologia detestă vidul – patru decenii în domeniu m-au învățat asta. Acolo unde există capacitate, va veni ceva care să o folosească.

Celălalt pantof a căzut la începutul lui septembrie, când HuggingFace AI – a lansat o firmă privată care creează instrumente software care exploatează tehnici de ultimă oră de inteligență artificială Difuzie stabilă.

Similar cu sisteme precum DALL•E și Mijlocul călătoriei, Stable Diffusion se ridică, apoi reduce miliarde de imagini la simboluri ponderate simbolic, care pot fi aduse înapoi în vizibilitate cu un mesaj text creat corespunzător. Întregul lucru se află doar de această parte a vrăjitoriei – totuși funcționează remarcabil de bine.

Spre deosebire de DALL•E sau Midjourney, Stable Diffusion este atât complet autonom – capabil să ruleze pe orice mașină suficient de puternică – cât și pur FOSS. Aceasta a însemnat că, deși lansarea inițială a necesitat unele dintre cele mai înalte GPU-uri ale Nvidia, în decurs de o săptămână, colaboratorii au avut și-a dezbrăcat codul și și-a redus cerințele hardware. Versiunea actuală poate rula destul de confortabil pe computerul robust pe care l-am cumpărat în urmă cu șase ani pentru a explora lumea nou renascută a realității virtuale – precum și pe aproape orice Mac bazat pe M1. Multe PC-uri și laptop-uri pentru jocuri pot rula Stable Diffusion suficient de bine pentru a o folosi pentru nevoi creative bazate pe proiecte – sau doar pentru distracție.

Apoi un grup de cercetători a publicat o lucrare pe ceva ce au numit Dreamfusion – capabil să evoce o serie infinită de modele 3D realizate pe deplin din mesaje text. Introduceți pineapple, iar computerul se va gândi, apoi va genera cea mai bună aproximare a modului în care ar trebui să arate acel model. Deși acel grup nu și-a lansat încă codul, lucrarea a oferit un model suficient pentru ca un programator ambițios să adapteze baza de cod Stable Diffusion pentru a crea Fuziune stabilă de vise – care, din nou, necesită hardware destul de puternic.

O imagine produsă de Stable Diffusion din mesajul de text „Un robot pictează o imagine în timp ce alergă pe o bandă de alergare”… Faceți clic pentru a mări

Pentru a nu fi mai prejos, un alt grup de la Universitatea din Tel Aviv a uimit lumea cu Modelul de difuzie a mișcării umane. Această lucrare a arătat modul în care cercetătorii au folosit tehnici AI bazate pe difuzie pentru a converti un prompt precum „the person walks forward two steps and does a cartwheel” într-o animație umană. O săptămână mai târziu, cercetătorii înșiși și-au eliberat codul ca FOSS.

Suntem încă puțin devreme în această creștere exponențială a capabilităților AI pentru a ști unde va duce oricare dintre acestea. Deja, atât Canva, cât și Microsoft au integrat generatoare de imagini bazate pe prompt în instrumentele lor creative. meta, Google, și alții au demonstrat generatoare proprietare prompt-to-video. Conform tendinței actuale, nu va trebui să așteptăm mult până când vom avea echivalente FOSS cu care să ne jucăm.

Artele vizuale au instrumente noi puternice, care nu sunt domeniul exclusiv al unor giganți precum Google sau OpenAI – acesta din urmă o firmă care a promis că va democratiza AI la fundație, dar pare să se fi concentrat în mod pervers pe crearea propriului imperiu proprietar cu Microsoft ca ei. proprietar neoficial.

Într-una din primele mele coloane pentru Registrul am arătat spre sfârșit a ciclului nesfârșit de upgrade pentru computere. Gata cu banda de alergare: suficient de bune, ar fi înlocuite doar când s-au uzat. Cu excepția unui val de upgrade-uri pentru a se adapta videoconferințe conduse de pandemie acea predicție s-a dovedit corectă.

Dar computerul personal și-a părăsit pielea, dezvăluind noua sa formă de supercomputer creativ: alimentat de difuzie și capabil creativ în moduri pe care PC-ul de odinioară nu putea începe să se apropie. În loc să ofere un alt stilou sau pensulă nouă, aceste instrumente calitativ diferite creează un nou tip de parteneriat creativ.

În iunie am achiziționat un laptop PC cu specificații înalte – și m-am simțit imediat vinovat pentru el, crezând că nu-l voi pune niciodată la treabă. Astăzi, folosesc din plin o mașinărie care poate face atât cotidianul, cât și incredibilul. Privind retrospectiv, acea achiziție pare un chilipir inteligent – ​​un prevestitor al unei adevărate renașteri – în timp ce PC-ul, renascut, se apucă de treabă. ®

Timestamp-ul:

Mai mult de la Registrul