Kreativitas berbasis AI memberi PC yang terlalu kuat sesuatu yang berharga untuk dilakukan, akhirnya

Node Sumber: 1729591

Kolom Sampai baru-baru ini, perangkat keras komputer pribadi tampaknya telah melampaui tuntutan apa pun yang mungkin diberikan oleh perangkat lunak padanya. Bahkan game kelas atas – yang secara tradisional merupakan tuntutan pengguna pada kinerja – hampir tidak membebani silikon kelas atas yang tersedia secara besar-besaran. Kemudian seni AI datang.

Mikroprosesor M1 Ultra Apple menampilkan jumlah transistor di utara 100 miliar. Nvidia baru saja merilis unggulan RTX 4090 GPU, dengan 76 miliar transistor – peningkatan tiga kali lipat dari generasi sebelumnya, produk dari node proses terbaru, dan sikap tidak peduli terhadap konsumsi daya. Hampir 500W TDP? Angkat dan panaskan rumah Anda di musim dingin ini.

Tapi untuk tujuan apa? Sebuah pertempuran royale Fortnite 300fps? Pada bulan April Saya menulis: “Monster-monster ini perlu dijinakkan, dilatih, dan dipekerjakan.” Teknologi membenci kekosongan – empat dekade di bidang ini telah mengajari saya hal itu. Di mana ada kapasitas, sesuatu akan datang untuk menggunakannya.

Sepatu lain itu jatuh pada awal September, ketika Memeluk Wajah AI – sebuah perusahaan swasta yang membuat perangkat lunak yang mengeksploitasi teknik kecerdasan buatan mutakhir – dirilis Difusi Stabil.

Mirip dengan sistem seperti DALL•E dan tengah perjalanan, Difusi Stabil naik kemudian mengurangi miliaran gambar menjadi token berbobot simbolis yang dapat disulap kembali ke visibilitas dengan prompt teks yang dibuat dengan tepat. Semuanya berada tepat di sisi sihir ini – namun bekerja dengan sangat baik.

Tidak seperti DALL•E atau Midjourney, Stable Diffusion sepenuhnya mandiri – mampu berjalan pada mesin yang cukup bertenaga – dan FOSS murni. Ini berarti bahwa meskipun rilis awal memerlukan beberapa GPU kelas atas Nvidia, dalam waktu seminggu kontributor proyek telah dilucuti kodenya dan mengurangi kebutuhan perangkat kerasnya. Versi saat ini dapat berjalan dengan cukup nyaman di PC gemuk yang saya beli enam tahun lalu untuk menjelajahi dunia realitas virtual yang baru lahir kembali – serta di hampir semua Mac berbasis M1. Banyak PC game dan laptop dapat menjalankan Difusi Stabil dengan cukup baik untuk digunakan untuk kebutuhan kreatif berbasis proyek – atau hanya untuk bersenang-senang.

Kemudian sekelompok peneliti menerbitkan sebuah makalah pada sesuatu yang mereka sebut Dreamfusion – mampu menyulap rangkaian tak terbatas model 3D yang direalisasikan sepenuhnya dari petunjuk teks. Ketik pineapple, dan komputer akan berpikir, lalu menghasilkan perkiraan terbaiknya tentang seperti apa model itu seharusnya. Meskipun grup itu belum merilis kodenya, makalah ini menyediakan cetak biru yang cukup bagi pembuat kode yang ambisius untuk mengadaptasi basis kode Difusi Stabil untuk membuat Dreamfusion yang Stabil – yang, sekali lagi, membutuhkan perangkat keras yang cukup kuat.

Gambar yang dihasilkan oleh Difusi Stabil dari prompt teks 'Robot melukis gambar sambil berlari di atas treadmill' … Klik untuk memperbesar

Tidak mau kalah, kelompok lain di Universitas Tel Aviv mengejutkan dunia dengan Model Difusi Gerak Manusia. Makalah ini menunjukkan bagaimana para peneliti telah menggunakan teknik AI berbasis Difusi untuk mengonversi prompt seperti “the person walks forward two steps and does a cartwheel” menjadi animasi humaniform. Seminggu kemudian, para peneliti sendiri merilis kode mereka sebagai FOSS.

Kami masih sedikit lebih awal dalam pertumbuhan eksponensial dalam kemampuan AI ini untuk mengetahui ke mana arahnya. Canva dan Microsoft telah mengintegrasikan generator gambar berbasis prompt dalam alat kreatif mereka. meta, Google, dan yang lainnya telah mendemonstrasikan generator prompt-to-video berpemilik. Pada tren saat ini, kita tidak perlu menunggu lama sampai kita memiliki FOSS yang setara untuk dimainkan.

Seni visual memiliki alat baru yang kuat yang bukan domain eksklusif raksasa seperti Google atau OpenAI – yang terakhir adalah perusahaan yang berjanji untuk mendemokratisasikan AI pada dasarnya, tetapi tampaknya telah berfokus untuk menciptakan kerajaan miliknya sendiri dengan Microsoft sebagai miliknya. pemilik tidak resmi.

Di salah satu kolom pertama saya untuk Pendaftaran Saya menunjuk ke akhir dari siklus upgrade tak berujung untuk PC. Tidak ada lagi treadmill: cukup bagus, mereka hanya akan diganti jika sudah aus. Dengan pengecualian kesibukan peningkatan untuk mengakomodasi konferensi video yang didorong oleh pandemi prediksi itu terbukti benar.

Tetapi komputer pribadi telah berganti kulit, mengungkapkan bentuk barunya yang apik sebagai superkomputer kreatif: Bertenaga difusi, dan mampu secara kreatif dengan cara yang tidak dapat didekati oleh PC lama. Alih-alih menawarkan stylus atau kuas baru lainnya, alat yang berbeda secara kualitatif ini membentuk kemitraan kreatif jenis baru.

Pada bulan Juni saya melakukan pembelian laptop PC spesifikasi tinggi – dan langsung merasa bersalah karenanya, berpikir bahwa saya tidak akan pernah benar-benar menjalankannya. Hari ini, saya memanfaatkan sepenuhnya mesin yang dapat melakukan baik quotidian maupun yang luar biasa. Dalam retrospeksi, pembelian itu tampak seperti tawar-menawar yang cerdas – pertanda kebangkitan sejati – saat PC, terlahir kembali, mulai bekerja. ®

Stempel Waktu:

Lebih dari Pendaftaran