La creatividad impulsada por la IA les da a las PC dominadas algo que vale la pena hacer, por fin

Nodo de origen: 1729591

Columna Hasta hace poco, el hardware de la computadora personal parecía haber superado cualquier demanda que el software pudiera imponerle. Incluso los juegos de alta gama, tradicionalmente la vanguardia de las demandas de rendimiento de los usuarios, apenas gravaron el silicio de alta gama disponible, abrumado masivamente. Luego apareció el arte de la IA.

El microprocesador M1 Ultra de Apple luce una cuenta de transistores al norte de 100 mil millones. Nvidia acaba de lanzar su GPU insignia RTX 4090, con 76 500 millones de transistores: un aumento del triple con respecto a la generación anterior, el producto del nodo de proceso más reciente y una actitud despreocupada hacia el consumo de energía. Casi XNUMXW TDP? Póngalo en marcha y caliente su hogar este invierno.

Pero ¿con qué propósito? ¿Un Battle Royale de Fortnite a 300 fps? En abril Yo escribí:: “Estos monstruos necesitan ser domesticados, entrenados y puestos a trabajar”. La tecnología aborrece el vacío: cuatro décadas en el campo me lo han enseñado. Donde hay capacidad, algo vendrá para emplearla.

Ese otro zapato cayó a principios de septiembre, cuando HuggingFace IA – una empresa privada que crea herramientas de software que explotan técnicas de inteligencia artificial de vanguardia – lanzado Difusión estable.

Similar a sistemas como DALL•E y a mitad de camino, Stable Diffusion aspira y luego reduce miles de millones de imágenes a tokens ponderados simbólicamente que pueden volver a ser visibles con un mensaje de texto diseñado adecuadamente. Todo se encuentra justo en este lado de la brujería, pero funciona notablemente bien.

A diferencia de DALL•E o Midjourney, Stable Diffusion es totalmente autónomo (capaz de ejecutarse en cualquier máquina lo suficientemente potente) y FOSS puro. Esto significó que, aunque el lanzamiento inicial requería algunas de las GPU de gama más alta de Nvidia, en una semana los colaboradores del proyecto habían eliminó su código y redujo sus requisitos de hardware. La versión actual puede ejecutarse con bastante comodidad en la robusta PC que compré hace seis años para explorar el nuevo mundo de la realidad virtual, así como en prácticamente cualquier Mac basada en M1. Muchas PC y laptops para juegos pueden ejecutar Stable Diffusion lo suficientemente bien como para usarla para necesidades creativas basadas en proyectos, o simplemente por diversión.

Luego, un grupo de investigadores publicado un documento en algo que llamaron Dreamfusion, capaz de conjurar una serie infinita de modelos 3D completamente realizados a partir de indicaciones de texto. Escribir pineapple, y la computadora pensará, luego generará su mejor aproximación de cómo debería verse ese modelo. Si bien ese grupo aún no ha publicado su código, el documento proporcionó un modelo suficiente para que un codificador ambicioso adapte el código base de Stable Diffusion para crear Fusión onírica estable – que, de nuevo, requiere un hardware bastante potente.

Una imagen producida por Stable Diffusion a partir del mensaje de texto 'Un robot pintando un cuadro mientras corre en una caminadora'... Haga clic para ampliar

Para no quedarse atrás, otro grupo de la Universidad de Tel Aviv asombró al mundo con la Modelo de difusión de movimiento humano. Este documento mostró cómo los investigadores habían utilizado técnicas de inteligencia artificial basadas en difusión para convertir un aviso como "the person walks forward two steps and does a cartwheel” en una animación humaniforme. Una semana después, los propios investigadores lanzó su código como FOSS.

Todavía estamos un poco temprano en este crecimiento exponencial de las capacidades de IA para saber a dónde conducirá. Tanto Canva como Microsoft ya han integrado generadores de imágenes basados ​​en indicaciones dentro de sus herramientas creativas. Meta, Google, y otros han demostrado generadores patentados de mensajes a video. Con la tendencia actual, no tendremos que esperar mucho hasta que tengamos equivalentes de FOSS con los que jugar.

Las artes visuales tienen herramientas nuevas y poderosas que no son dominio exclusivo de gigantes como Google u OpenAI; esta última, una empresa que prometió democratizar la IA desde su fundación, pero perversamente parece haberse centrado en crear su propio imperio propietario con Microsoft como su propietario no oficial.

En una de mis primeras columnas para El registro señalé a el fin del interminable ciclo de actualización para PC. No más cintas de correr: lo suficientemente bueno, solo se reemplazarían cuando se desgastaran. Con la excepción de una ráfaga de actualizaciones para acomodar videoconferencia impulsada por la pandemia esa predicción ha demostrado ser correcta.

Pero la computadora personal se ha mudado de piel, revelando su nueva forma elegante como una supercomputadora creativa: impulsada por difusión y creativamente capaz de maneras que la PC de antaño no podía comenzar a acercarse. En lugar de ofrecer otro lápiz óptico o pincel nuevo, estas herramientas cualitativamente diferentes forjan un nuevo tipo de asociación creativa.

En junio compré una computadora portátil PC de alta especificación e inmediatamente me sentí culpable, pensando que nunca la pondría a trabajar. Hoy, hago pleno uso de una máquina que puede hacer tanto lo cotidiano como lo increíble. En retrospectiva, esa compra parece una ganga inteligente, un presagio de un verdadero renacimiento, ya que la PC, renacida, se pone a trabajar. ®

Sello de tiempo:

Mas de El registro