Cuối cùng, khả năng sáng tạo dựa trên trí tuệ nhân tạo mang lại cho những chiếc PC mạnh mẽ hơn là điều đáng làm

Nút nguồn: 1729591

Cột Cho đến gần đây, phần cứng máy tính cá nhân dường như đã vượt qua mọi yêu cầu mà phần mềm có thể đặt ra. Ngay cả các trò chơi cao cấp - theo truyền thống là yêu cầu hàng đầu của người dùng về hiệu suất - hầu như không đánh thuế silicon hàng đầu, mạnh mẽ có sẵn. Sau đó, nghệ thuật AI ra đời.

Bộ vi xử lý M1 Ultra của Apple có số lượng bóng bán dẫn ở phía bắc là 100 tỷ. Nvidia vừa phát hành GPU RTX 4090 hàng đầu, với 76 tỷ bóng bán dẫn - tăng gấp ba lần so với thế hệ trước, sản phẩm của nút quy trình mới nhất và thái độ quan tâm đến mức tiêu thụ điện năng. TDP gần 500W? Hãy trang bị và sưởi ấm ngôi nhà của bạn trong mùa đông này.

Nhưng nhằm mục đích gì? Một trận chiến Fortnite 300 khung hình / giây? Vào tháng Tư Tôi đã viết: "Những con quái vật này cần được thuần hóa, huấn luyện và hoạt động." Công nghệ ghê tởm chân không - bốn thập kỷ trong lĩnh vực này đã dạy tôi điều đó. Khi có năng lực, điều gì đó sẽ đến để sử dụng nó.

Chiếc giày kia đã bị rơi vào đầu tháng XNUMX, khi AI trên khuôn mặt - một công ty tư nhân tạo ra các công cụ phần mềm khai thác các kỹ thuật trí tuệ nhân tạo tiên tiến - đã phát hành Khuếch tán ổn định.

Tương tự với các hệ thống như DALL • E và midjourney, Diffusion ổn định di chuyển lên sau đó giảm hàng tỷ hình ảnh thành các mã thông báo có trọng số tượng trưng có thể được gợi ý trở lại khả năng hiển thị với lời nhắc văn bản được tạo thủ công phù hợp. Toàn bộ mọi thứ chỉ nằm ở khía cạnh này của phép thuật phù thủy - nhưng nó hoạt động rất tốt.

Không giống như DALL • E hoặc Midjourney, Stable Diffusion vừa hoàn toàn khép kín - có thể chạy trên bất kỳ máy nào đủ mạnh - vừa là FOSS thuần túy. Điều này có nghĩa là mặc dù bản phát hành ban đầu yêu cầu một số GPU cao cấp nhất của Nvidia, nhưng trong vòng một tuần, những người đóng góp cho dự án đã tước lại mã của nó và giảm yêu cầu phần cứng của nó. Phiên bản hiện tại có thể chạy khá thoải mái trên chiếc PC mạnh mẽ mà tôi đã mua cách đây sáu năm để khám phá thế giới thực tế ảo mới được tái sinh - cũng như trên hầu hết mọi máy Mac dựa trên M1. Nhiều PC chơi game và máy tính xách tay có thể chạy Hệ thống khuếch tán ổn định đủ tốt để sử dụng cho các nhu cầu sáng tạo dựa trên dự án - hoặc chỉ để giải trí.

Sau đó, một nhóm các nhà nghiên cứu xuất bản một bài báo trên một thứ mà họ gọi là Dreamfusion - có khả năng tạo ra một loạt vô hạn các mô hình 3D được thực hiện đầy đủ từ lời nhắc văn bản. Gõ vào pineapple, và máy tính sẽ suy nghĩ, sau đó tạo ra giá trị gần đúng nhất của nó về mô hình đó sẽ trông như thế nào. Mặc dù nhóm đó chưa phát hành mã của mình, nhưng bài báo đã cung cấp đủ bản thiết kế cho một lập trình viên đầy tham vọng để điều chỉnh cơ sở mã Khuếch tán Ổn định để tạo Giấc mơ ổn định - một lần nữa, yêu cầu phần cứng khá mạnh.

Một hình ảnh do Stable Diffusion tạo ra từ dòng nhắc văn bản 'Một người máy vẽ một bức tranh khi đang chạy trên máy chạy bộ' ... Nhấp để phóng to

Không chịu thua kém, một nhóm khác tại Đại học Tel Aviv đã làm cả thế giới kinh ngạc với Mô hình khuếch tán chuyển động của con người. Bài báo này cho thấy cách các nhà nghiên cứu đã sử dụng các kỹ thuật AI dựa trên sự khuếch tán để chuyển đổi một lời nhắc chẳng hạn như “the person walks forward two steps and does a cartwheel”Thành một hình ảnh động dạng nhân văn. Một tuần sau, chính các nhà nghiên cứu phát hành mã của họ như phần mềm nguồn mở.

Chúng ta vẫn còn hơi sớm trong sự phát triển theo cấp số nhân này trong các khả năng của AI để biết bất kỳ khả năng nào của nó sẽ dẫn đến đâu. Cả Canva và Microsoft đều đã tích hợp trình tạo hình ảnh dựa trên lời nhắc trong các công cụ sáng tạo của họ. Meta, Googlevà những người khác đã chứng minh trình tạo video nhắc đến video độc quyền. Theo xu hướng hiện tại, chúng ta sẽ không phải đợi lâu cho đến khi chúng ta có các phần mềm nguồn mở tương đương để chơi cùng.

Nghệ thuật thị giác có những công cụ mới mạnh mẽ không phải là lĩnh vực độc quyền của những gã khổng lồ như Google hay OpenAI - công ty sau này hứa hẹn sẽ dân chủ hóa AI ở nền tảng của nó, nhưng ngược lại dường như đã tập trung vào việc tạo ra đế chế độc quyền của riêng mình với Microsoft là chủ sở hữu không chính thức.

Trong một trong những cột đầu tiên của tôi cho Đăng ký Tôi đã chỉ vào cuối cùng của chu kỳ nâng cấp vô tận cho PC. Không còn máy chạy bộ: đủ tốt, chúng sẽ chỉ được thay thế khi chúng đã hết. Ngoại trừ một loạt các nâng cấp để phù hợp với hội nghị truyền hình theo hướng đại dịch dự đoán đó đã được chứng minh là đúng.

Nhưng máy tính cá nhân đã lột xác, để lộ hình dạng mới bóng bẩy như một siêu máy tính sáng tạo: chạy bằng khuếch tán và có khả năng sáng tạo theo những cách mà PC cũ không thể tiếp cận. Thay vì cung cấp một bút cảm ứng hoặc cọ vẽ mới khác, những công cụ khác nhau về chất lượng này tạo nên một kiểu hợp tác sáng tạo mới.

Vào tháng XNUMX, tôi đã mua một chiếc máy tính xách tay PC cấu hình cao - và ngay lập tức cảm thấy tội lỗi vì nó, nghĩ rằng tôi sẽ không bao giờ thực sự đưa nó vào hoạt động. Hôm nay, tôi sử dụng triệt để một cỗ máy có thể làm được cả điều đáng kinh ngạc và điều đáng kinh ngạc. Nhìn lại, giao dịch mua đó trông giống như một món hời thông minh - báo hiệu về một thời kỳ phục hưng thực sự - khi PC, được tái sinh, bắt đầu hoạt động. ®

Dấu thời gian:

Thêm từ Đăng ký