La creatività basata sull'intelligenza artificiale offre finalmente ai PC sopraffatti qualcosa di utile da fare

Nodo di origine: 1729591

Colonna Fino a poco tempo fa, l'hardware dei personal computer sembrava aver superato qualsiasi richiesta che il software potesse imporre su di esso. Persino i giochi di fascia alta – tradizionalmente all'avanguardia nelle richieste degli utenti in termini di prestazioni – hanno a malapena messo a dura prova il silicio di fascia alta, massicciamente sopraffatto, disponibile. Poi è arrivata l’arte dell’intelligenza artificiale.

Il microprocessore M1 Ultra di Apple vanta un numero di transistor che supera i 100 miliardi. Nvidia ha appena rilasciato il suo GPU RTX 4090 di punta, con 76 miliardi di transistor: un aumento di tre volte rispetto alla generazione precedente, il prodotto dell'ultimo nodo di processo e un atteggiamento disinvolto nei confronti del consumo energetico. Quasi 500 W TDP? Alza il volume e riscalda la tua casa quest'inverno.

Ma a quale scopo? Una battaglia reale di Fortnite a 300 fps? In Aprile Ho scritto: "Questi mostri devono essere domati, addestrati e messi al lavoro." La tecnologia detesta il vuoto: quattro decenni di esperienza nel settore me lo hanno insegnato. Dove c'è capacità, arriverà qualcosa per impiegarla.

Quell'altra scarpa è caduta all'inizio di settembre, quando HuggingFace AI – rilasciata un’azienda privata che crea strumenti software che sfruttano tecniche di intelligenza artificiale all’avanguardia Diffusione stabile.

Simile ai sistemi come DALL•E e Metà viaggio, Stable Diffusion recupera e riduce miliardi di immagini in token simbolicamente ponderati che possono essere richiamati alla visibilità con un messaggio di testo opportunamente predisposto. Il tutto si trova proprio al di qua della stregoneria, eppure funziona straordinariamente bene.

A differenza di DALL•E o Midjourney, Stable Diffusion è completamente autonomo – in grado di funzionare su qualsiasi macchina sufficientemente potente – e FOSS puro. Ciò significava che, sebbene la versione iniziale richiedesse alcune delle GPU di fascia più alta di Nvidia, nel giro di una settimana i contributori del progetto avevano rimosso il suo codice e ridotto i requisiti hardware. La versione attuale può funzionare abbastanza comodamente sul robusto PC che ho acquistato sei anni fa per esplorare il mondo appena rinato della realtà virtuale, nonché su praticamente qualsiasi Mac basato su M1. Molti PC e laptop da gioco possono eseguire Stable Diffusion abbastanza bene da poterlo utilizzare per esigenze creative basate su progetti o semplicemente per divertimento.

Poi un gruppo di ricercatori pubblicato un documento su qualcosa che hanno chiamato Dreamfusion, capace di evocare una serie infinita di modelli 3D completamente realizzati da istruzioni di testo. Digitare pineapple, e il computer ci penserà, quindi genererà la migliore approssimazione di come dovrebbe apparire quel modello. Sebbene quel gruppo non abbia ancora rilasciato il suo codice, il documento ha fornito un progetto sufficiente per un programmatore ambizioso per adattare la base di codice Stable Diffusion per creare Fusione onirica stabile – che, ancora una volta, richiede hardware abbastanza potente.

Un'immagine prodotta da Stable Diffusion dal testo suggerito "Un robot che dipinge un'immagine mentre corre su un tapis roulant"... Clicca per ingrandire

Per non essere da meno, un altro gruppo dell'Università di Tel Aviv ha stupito il mondo con il Modello di diffusione del movimento umano. Questo articolo ha mostrato come i ricercatori abbiano utilizzato tecniche di intelligenza artificiale basate sulla diffusione per convertire un prompt come "the person walks forward two steps and does a cartwheel" in un'animazione umanoide. Una settimana dopo, i ricercatori stessi hanno rilasciato il loro codice come FOSS.

Siamo ancora un po’ all’inizio di questa crescita esponenziale delle capacità dell’intelligenza artificiale per sapere dove porterà tutto ciò. Sia Canva che Microsoft hanno già integrato generatori di immagini basati su prompt nei loro strumenti creativi. Meta, Googlee altri hanno dimostrato generatori di prompt-to-video proprietari. Seguendo la tendenza attuale, non dovremo aspettare molto prima di avere gli equivalenti FOSS con cui giocare.

Le arti visive dispongono di nuovi e potenti strumenti che non sono dominio esclusivo di giganti come Google o OpenAI – quest’ultima un’azienda che ha promesso di democratizzare l’intelligenza artificiale fin dalla sua fondazione, ma sembra essersi perversamente concentrata sulla creazione di un proprio impero proprietario con Microsoft come suo leader. proprietario non ufficiale.

In una delle mie prime colonne per Il registro ho indicato Alla fine del ciclo infinito di aggiornamento dei PC. Niente più tapis roulant: abbastanza buoni, verrebbero sostituiti solo quando si usurassero. Con l'eccezione di una raffica di aggiornamenti per accogliere videoconferenze guidate dalla pandemia tale previsione si è rivelata corretta.

Ma il personal computer ha cambiato pelle, rivelando la sua nuova forma di supercomputer creativo: alimentato dalla diffusione e capace di creatività in modi che i PC del passato non potevano nemmeno avvicinarsi. Invece di offrire un nuovo stilo o pennello, questi strumenti qualitativamente diversi danno vita a un nuovo tipo di partnership creativa.

A giugno ho acquistato un PC portatile con specifiche elevate e mi sono subito sentito in colpa, pensando che non l'avrei mai messo davvero in pratica. Oggi faccio pieno uso di una macchina che può fare sia il quotidiano che l’incredibile. In retrospettiva, quell’acquisto sembra un affare intelligente – un presagio di un vero rinascimento – mentre il PC, rinato, si mette al lavoro. ®

Timestamp:

Di più da Il registro