Творчество, основанное на искусственном интеллекте, наконец-то дает сверхмощным ПК что-то стоящее

Исходный узел: 1729591

Column До недавнего времени аппаратное обеспечение персональных компьютеров, казалось, превосходило любые требования, которые к нему могло предъявлять программное обеспечение. Даже высококлассные игры — традиционно самые высокие требования пользователей к производительности — почти не требовали огромных мощностей, доступного топового кремния. Затем появилось искусство ИИ.

Микропроцессор Apple M1 Ultra имеет количество транзисторов, превышающее 100 миллиардов. Nvidia только что выпустила флагманский графический процессор RTX 4090, с 76 миллиардами транзисторов — трехкратное увеличение по сравнению с предыдущим поколением, продукт новейшего техпроцесса и наплевательского отношения к энергопотреблению. Почти 500 Вт TDP? Включите его и согрейте свой дом этой зимой.

Но с какой целью? Королевская битва Fortnite со скоростью 300 кадров в секунду? В апреле Я написал: «Этих монстров нужно приручить, обучить и заставить работать». Технологии не терпят пустоты — четыре десятилетия в этой области научили меня этому. Там, где есть возможности, появится что-то, чтобы использовать их.

Тот другой ботинок упал в начале сентября, когда Обнимающее лицо AI – частная фирма, создающая программные инструменты, использующие передовые методы искусственного интеллекта – выпущена Стабильная диффузия.

Подобно системам, таким как DALL•E и Середина пути, Stable Diffusion выполняет поиск, а затем сокращает миллиарды изображений до символически взвешенных токенов, которые можно снова сделать видимыми с помощью соответствующим образом созданного текстового приглашения. Все это находится как раз на этой стороне колдовства, но работает на удивление хорошо.

В отличие от DALL•E или Midjourney, Stable Diffusion является одновременно полностью автономным — он может работать на любой достаточно мощной машине — и чистым FOSS. Это означало, что, хотя для первоначального выпуска требовались одни из самых мощных графических процессоров Nvidia, в течение недели участники проекта убрал свой код и снизил требования к оборудованию. Текущая версия вполне комфортно работает на мощном ПК, который я купил шесть лет назад, чтобы исследовать только что возродившийся мир виртуальной реальности, а также практически на любом Mac на базе M1. Многие игровые ПК и ноутбуки могут работать со Stable Diffusion достаточно хорошо, чтобы использовать его для творческих нужд на основе проектов или просто для развлечения.

Затем группа исследователей опубликовал статью на чем-то, что они назвали Dreamfusion, способном создавать бесконечную серию полностью реализованных 3D-моделей из текстовых подсказок. Введите pineapple, и компьютер подумает, а затем сгенерирует наилучшее приближение того, как должна выглядеть эта модель. Хотя эта группа еще не выпустила свой код, документ предоставил достаточно плана для амбициозного программиста, чтобы адаптировать кодовую базу Stable Diffusion для создания Стабильный слияние снов — что, опять же, требует довольно мощного железа.

Изображение, созданное Stable Diffusion из текстовой подсказки «Робот, рисующий картинку во время бега на беговой дорожке»… Нажмите, чтобы увеличить

Чтобы не отставать, другая группа из Тель-Авивского университета поразила мир Модель распространения человеческого движения. В этой статье показано, как исследователи использовали методы искусственного интеллекта на основе диффузии для преобразования таких подсказок, как «the person walks forward two steps and does a cartwheelв человекоподобную анимацию. Спустя неделю сами исследователи выпустили свой код как ФОСС.

Мы еще слишком рано начали этот экспоненциальный рост возможностей ИИ, чтобы знать, к чему это приведет. И Canva, и Microsoft уже интегрировали генераторы изображений на основе подсказок в свои творческие инструменты. Мета, Google, и другие продемонстрировали проприетарные генераторы подсказок к видео. Учитывая текущую тенденцию, нам не придется долго ждать, пока у нас появятся эквиваленты FOSS для экспериментов.

В изобразительном искусстве появились мощные новые инструменты, которые не являются исключительной прерогативой таких гигантов, как Google или OpenAI — последняя фирма, которая изначально обещала демократизировать ИИ, но, похоже, извращенно сосредоточилась на создании собственной проприетарной империи с Microsoft в качестве неофициальный владелец.

В одной из моих первых колонок для Регистр я указал на В конце бесконечного цикла обновления ПК. Больше никаких беговых дорожек: достаточно хорошо, их заменят только тогда, когда они изнашиваются. За исключением шквала обновлений для размещения видеоконференцсвязь в связи с пандемией этот прогноз оказался верным.

Но персональный компьютер сбросил свою оболочку, обнажая свою гладкую новую форму творческого суперкомпьютера: работающего на основе диффузии и обладающего творческими способностями, к которым старые ПК не могли приблизиться. Вместо того, чтобы предлагать еще один новый стилус или кисть, эти качественно разные инструменты создают новый вид творческого партнерства.

В июне я купил высокопроизводительный портативный компьютер и сразу почувствовал себя виноватым, думая, что никогда не заставлю его работать. Сегодня я в полной мере использую машину, которая может делать как обычные, так и невероятные вещи. Оглядываясь назад, эта покупка выглядит как удачная сделка — предвестник настоящего возрождения — когда возрожденный ПК приступает к работе. ®

Отметка времени:

Больше от Регистр