Креативність, керована штучним інтелектом, нарешті дає потужним ПК щось варте уваги

Вихідний вузол: 1729591

Колонка До недавнього часу здавалося, що апаратне забезпечення персонального комп’ютера перевершило будь-які вимоги, які програмне забезпечення могло до нього поставити. Навіть ігри високого класу – традиційно передові вимоги користувачів до продуктивності – ледве обтяжували надто потужний доступний топовий кремній. Потім з’явилося мистецтво ШІ.

Мікропроцесор M1 Ultra від Apple має кількість транзисторів на північ від 100 мільярдів. Nvidia щойно випустила його флагманський графічний процесор RTX 4090, із 76 мільярдами транзисторів – триразове збільшення порівняно з попереднім поколінням, продукт найновішого технологічного вузла та байдуже ставлення до енергоспоживання. Майже 500 Вт TDP? Розпочніть і обігрійте свій дім цієї зими.

Але з якою метою? Королівська битва Fortnite зі швидкістю 300 кадрів/с? В квітні Я написав: «Цих монстрів потрібно приборкати, дресирувати та залучати до роботи». Технології не терплять вакууму – чотири десятиліття в цій галузі навчили мене цьому. Там, де є потенціал, з’явиться щось, щоб його використати.

Той інший черевик впав на початку вересня, коли HuggingFace AI – приватна фірма, яка розробляє програмні інструменти, які використовують передові технології штучного інтелекту – випущено Стабільна дифузія.

Подібно до таких систем, як DALL•E і Серед подорожі, Stable Diffusion очищає, а потім зменшує мільярди зображень до символічно зважених токенів, які можна повернути у видимість за допомогою відповідного текстового підказки. Вся справа лежить лише на цьому боці чаклунства, але воно працює надзвичайно добре.

На відміну від DALL•E або Midjourney, Stable Diffusion є повністю автономним — може працювати на будь-якій досить потужній машині — і чистим FOSS. Це означало, що, незважаючи на те, що початковий випуск вимагав деяких із найсучасніших графічних процесорів Nvidia, протягом тижня учасники проекту мали видалив код і зменшив вимоги до обладнання. Поточна версія може досить комфортно працювати на потужному ПК, який я купив шість років тому, щоб досліджувати нещодавно відроджений світ віртуальної реальності, а також майже на будь-якому Mac на базі M1. Багато ігрових комп’ютерів і ноутбуків можуть запускати Stable Diffusion досить добре, щоб використовувати його для творчих потреб на основі проекту – або просто для розваги.

Потім група дослідників опублікував статтю на те, що вони назвали Dreamfusion – здатне створити нескінченну серію повністю реалізованих 3D-моделей із текстових підказок. Введіть pineapple, і комп’ютер подумає, а потім згенерує найкраще наближення того, як ця модель має виглядати. Хоча ця група ще не оприлюднила свій код, документ надав достатньо плану для амбітного програміста, щоб адаптувати кодову базу Stable Diffusion для створення Стабільний Dreamfusion – що, знову ж таки, вимагає досить потужного обладнання.

Зображення, створене Stable Diffusion із текстової підказки «Робот малює картинку під час бігу на біговій доріжці»… Натисніть, щоб збільшити

Інша група в Тель-Авівському університеті вразила світ своїми словами Модель дифузії руху людини. У цьому документі показано, як дослідники використовували методи штучного інтелекту на основі дифузії для перетворення підказок, таких як «the person walks forward two steps and does a cartwheel” в гуманітарну анімацію. Через тиждень самі дослідники випустили свій код як FOSS.

Це експоненціальне зростання можливостей штучного інтелекту ще на ранньому етапі, щоб знати, куди це приведе. І Canva, і Microsoft уже інтегрували генератори зображень на основі підказок у свої творчі інструменти. мета, Google, та інші продемонстрували запатентовані генератори підказок до відео. Зважаючи на поточну тенденцію, нам не доведеться довго чекати, поки ми не отримаємо еквіваленти FOSS, з якими можна пограти.

Образотворче мистецтво має потужні нові інструменти, які не є виключною сферою таких гігантів, як Google або OpenAI – остання фірма, яка обіцяла демократизувати штучний інтелект на своїй основі, але, здається, зосередилася на створенні власної пропрієтарної імперії з Microsoft як її неофіційний власник.

В одній із моїх перших колонок для Реєстр Я вказав на В кінці нескінченного циклу оновлення для ПК. Більше ніяких бігових доріжок: вони досить хороші, їх замінюють лише тоді, коли вони зношуються. За винятком шквалу оновлень для розміщення відеоконференції, керовані пандемією це передбачення виправдалося.

Але персональний комп’ютер скинув свою шкіру, відкривши свою нову форму як креативний суперкомп’ютер: дифузійний і творчо здатний до того, до чого старі комп’ютери не могли підійти. Замість того, щоб пропонувати новий стилус чи пензлик, ці якісно різні інструменти створюють новий вид творчого партнерства.

У червні я придбав високоякісний ноутбук — і відразу відчув провину за це, подумавши, що ніколи не запустив його в роботу. Сьогодні я сповна використовую машину, яка може робити як буденні, так і неймовірні речі. У ретроспективі ця покупка виглядає як розумна угода – провісник справжнього ренесансу – оскільки відроджений ПК починає працювати. ®

Часова мітка:

Більше від Реєстр