एआई-संचालित रचनात्मकता अतिशक्ति वाले पीसी को अंत में कुछ करने योग्य बनाती है

स्रोत नोड: 1729591

स्तंभ कुछ समय पहले तक, ऐसा लगता था कि पर्सनल कंप्यूटर हार्डवेयर किसी भी मांग से आगे निकल गया है, सॉफ़्टवेयर संभवतः उस पर रख सकता है। यहां तक ​​कि हाई-एंड गेम - पारंपरिक रूप से प्रदर्शन पर उपयोगकर्ता की मांग की अग्रणी बढ़त - उपलब्ध बड़े पैमाने पर प्रबल, टॉप-एंड सिलिकॉन पर मुश्किल से कर लगाया जाता है। फिर एआई कला साथ आई।

Apple का M1 अल्ट्रा माइक्रोप्रोसेसर एक ट्रांजिस्टर को 100 बिलियन के उत्तर में स्पोर्ट करता है। एनवीडिया ने अभी इसका विमोचन किया फ्लैगशिप आरटीएक्स 4090 जीपीयू, 76 बिलियन ट्रांजिस्टर के साथ - पिछली पीढ़ी की तुलना में तीन गुना वृद्धि, नवीनतम प्रक्रिया नोड का उत्पाद, और बिजली की खपत के प्रति एक शैतान-मे-केयर रवैया। लगभग 500W टीडीपी? इसे पियें और इस सर्दी में अपने घर को गर्म करें।

लेकिन किस मकसद से? एक 300fps Fortnite बैटल रॉयल? अप्रैल में मैंने लिखा था: "इन राक्षसों को वश में करने, प्रशिक्षित करने और काम पर लगाने की आवश्यकता है।" प्रौद्योगिकी एक शून्य से घृणा करती है - इस क्षेत्र में चार दशकों ने मुझे यह सिखाया है। जहां क्षमता होगी, वहां कुछ काम आएगा।

वह दूसरा जूता सितंबर की शुरुआत में गिरा, जब हगिंगफेस एआई - अत्याधुनिक आर्टिफिशियल इंटेलिजेंस तकनीकों का उपयोग करने वाले सॉफ़्टवेयर टूल बनाने वाली एक निजी फर्म - जारी किया गया स्थिर प्रसार.

DALL•E और . जैसे सिस्टम के समान मध्य यात्रा, स्थिर डिफ्यूजन हूवर करता है और फिर अरबों छवियों को प्रतीकात्मक रूप से भारित टोकन में कम कर देता है जिसे उचित रूप से तैयार किए गए टेक्स्ट प्रॉम्प्ट के साथ दृश्यता में वापस जोड़ा जा सकता है। पूरी बात जादू टोने के इस तरफ ही बैठती है - फिर भी यह उल्लेखनीय रूप से अच्छी तरह से काम करती है।

DALL•E या मिडजर्नी के विपरीत, स्थिर प्रसार दोनों पूरी तरह से आत्म-निहित है - किसी भी शक्तिशाली-पर्याप्त मशीन पर चलने में सक्षम - और शुद्ध FOSS। इसका मतलब यह था कि हालांकि प्रारंभिक रिलीज के लिए एनवीडिया के कुछ उच्चतम-अंत जीपीयू की आवश्यकता थी, एक सप्ताह के भीतर परियोजना योगदानकर्ताओं के पास था अपना कोड वापस छीन लिया और इसकी हार्डवेयर आवश्यकताओं को कम कर दिया। आभासी वास्तविकता की नई पुनर्जन्म दुनिया का पता लगाने के लिए छह साल पहले खरीदे गए बीफ पीसी पर वर्तमान संस्करण काफी आराम से चल सकता है - साथ ही साथ किसी भी एम 1-आधारित मैक पर। कई गेमिंग पीसी और लैपटॉप प्रोजेक्ट-आधारित रचनात्मक जरूरतों के लिए - या सिर्फ मनोरंजन के लिए इसका उपयोग करने के लिए पर्याप्त रूप से स्थिर प्रसार चला सकते हैं।

फिर शोधकर्ताओं का एक समूह एक पत्र में प्रकाशित कुछ पर जिसे उन्होंने ड्रीमफ्यूज़न कहा - पाठ संकेतों से पूरी तरह से महसूस किए गए 3D मॉडल की एक अनंत श्रृंखला को जोड़ने में सक्षम। में टाइप करें pineapple, और कंप्यूटर के पास एक विचार होगा, फिर उस मॉडल को कैसा दिखना चाहिए, इसका सबसे अच्छा अनुमान लगाएं। हालांकि उस समूह ने अभी तक अपना कोड जारी नहीं किया है, पेपर ने एक महत्वाकांक्षी कोडर के लिए पर्याप्त ब्लूप्रिंट प्रदान किया है ताकि स्थिर डिफ्यूजन कोडबेस को बनाने के लिए अनुकूलित किया जा सके। स्थिर ड्रीमफ्यूज़न - जिसके लिए, फिर से, काफी शक्तिशाली हार्डवेयर की आवश्यकता होती है।

स्टेबल डिफ्यूजन द्वारा निर्मित एक छवि टेक्स्ट प्रॉम्प्ट से 'एक रोबोट एक ट्रेडमिल पर दौड़ते हुए एक चित्र चित्रित करता है' ... विस्तार करने के लिए क्लिक करें

आगे नहीं बढ़ने के लिए, तेल अवीव विश्वविद्यालय के एक अन्य समूह ने दुनिया को चौंका दिया मानव गति प्रसार मॉडल. इस पत्र में दिखाया गया है कि कैसे शोधकर्ताओं ने एक संकेत को बदलने के लिए प्रसार-आधारित एआई तकनीकों का उपयोग किया था जैसे "the person walks forward two steps and does a cartwheel"एक मानवीय एनीमेशन में। एक हफ्ते बाद, शोधकर्ताओं ने खुद उनका कोड जारी किया एफओएसएस के रूप में।

हम अभी भी एआई क्षमताओं में इस घातीय वृद्धि में थोड़ा जल्दी हैं, यह जानने के लिए कि इसमें से कोई भी कहां ले जाएगा। पहले से ही, Canva और Microsoft दोनों ने अपने रचनात्मक उपकरणों के भीतर शीघ्र-आधारित छवि जनरेटर को एकीकृत किया है। मेटा, गूगल, और अन्य ने मालिकाना शीघ्र-से-वीडियो जनरेटर का प्रदर्शन किया है। वर्तमान प्रवृत्ति पर, हमें तब तक लंबा इंतजार नहीं करना पड़ेगा जब तक कि हमारे पास खेलने के लिए FOSS समकक्ष न हों।

विज़ुअल आर्ट्स में शक्तिशाली नए उपकरण हैं जो Google या OpenAI जैसे दिग्गजों के अनन्य डोमेन नहीं हैं - बाद वाली एक फर्म जिसने एआई को अपनी नींव में लोकतांत्रिक बनाने का वादा किया था, लेकिन ऐसा लगता है कि माइक्रोसॉफ्ट के साथ अपना खुद का मालिकाना साम्राज्य बनाने पर ध्यान केंद्रित किया है। अनौपचारिक मालिक।

मेरे पहले कॉलम में से एक में रजिस्टर मैंने इशारा किया समाप्त पीसी के लिए अंतहीन उन्नयन चक्र की। कोई और ट्रेडमिल नहीं: काफी अच्छा, उन्हें तभी बदला जाएगा जब वे खराब हो जाएंगे। समायोजित करने के लिए उन्नयन की हड़बड़ी के अपवाद के साथ महामारी से प्रेरित वीडियोकांफ्रेंसिंग वह भविष्यवाणी सही साबित हुई है।

लेकिन पर्सनल कंप्यूटर ने अपनी त्वचा को बहा दिया है, एक रचनात्मक सुपरकंप्यूटर के रूप में अपने नए रूप को प्रकट किया है: प्रसार-संचालित, और रचनात्मक रूप से सक्षम तरीके से पुराने पीसी तक पहुंचना शुरू नहीं हो सका। एक और नया स्टाइलस या पेंटब्रश पेश करने के बजाय, ये गुणात्मक रूप से भिन्न टूल एक नई तरह की रचनात्मक साझेदारी बनाते हैं।

जून में मैंने एक हाई-स्पेक पीसी लैपटॉप की खरीद की - और तुरंत इसके लिए दोषी महसूस किया, यह सोचकर कि मैं इसे वास्तव में कभी काम पर नहीं लाऊंगा। आज, मैं एक ऐसी मशीन का पूरा उपयोग कर रहा हूं जो क्विडियन और अविश्वसनीय दोनों काम कर सकती है। पूर्व-निरीक्षण में, वह खरीदारी एक चतुर सौदेबाजी की तरह दिखती है - एक सच्चे पुनर्जागरण का अग्रदूत - जैसा कि पीसी, पुनर्जन्म, काम करने के लिए मिलता है। ®

समय टिकट:

से अधिक रजिस्टर

क्या होता है जब आपके बड़े पैमाने पर टेक्स्ट-जनरेटिंग न्यूरल नेट लोगों के फोन नंबरों को थूकने लगता है? यदि आप OpenAI हैं, तो आप एक फ़िल्टर बनाते हैं

स्रोत नोड: 822662
समय टिकट: मार्च 18, 2021