Google का दावा है कि Muse AI DALL-E 2 से बेहतर है

Google का दावा है कि Muse AI DALL-E 2 से बेहतर है

स्रोत नोड: 1867490

Google Muse AI टेक जायंट से एआई टूल्स के झुंड का नवीनतम एडिटॉन है जिसे हम हाल ही में देख रहे हैं। नया टेक्स्ट-टू-इमेज ट्रांसफॉर्मर मॉडल प्रतिस्पर्धी तरीकों की तुलना में तेज होने का दावा करता है, क्योंकि यह समानांतर डिकोडिंग और एक कॉम्पैक्ट, असतत अव्यक्त स्थान का उपयोग करता है। इसके डेवलपर्स के अनुसार, Google Muse AI अत्याधुनिक इमेज जनरेशन परफॉर्मेंस पर इमेज तैयार कर सकता है।

हम उपस्थित है सरस्वती, एक टेक्स्ट-टू-इमेज ट्रांसफॉर्मर मॉडल जो प्रसार या ऑटोरेग्रेसिव मॉडल की तुलना में काफी अधिक कुशल होने के साथ-साथ अत्याधुनिक छवि निर्माण प्रदर्शन को प्राप्त करता है।

Google सरस्वती एआई टीम

Google सरस्वती एआई क्या है?

Google Muse AI पहले के टेक्स्ट-टू-इमेज ट्रांसफ़ॉर्मर मॉडल जैसे Imagen और DALL-E 2 का एक कथित रूप से उन्नत संस्करण है। Muse को पूर्व-प्रशिक्षित बड़े भाषा मॉडल से प्राप्त टेक्स्ट एम्बेडिंग का उपयोग करके असतत टोकन स्थान में एक नकाबपोश मॉडलिंग कार्य पर प्रशिक्षित किया जाता है। (एलएलएम)।

Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती): नारंगी बीनी और धूप का चश्मा पहने एक शराबी हम्सटर की एक उच्च-विपरीत चित्र तस्वीर जिसमें लिखा है कि चलो पेंट करें

मनमाना रूप से अस्पष्ट की गई छवियों में टोकन की पहचान करने के लिए संग्रहालय को प्रशिक्षित किया गया है। असतत टोकन और छोटे नमूना आकार की आवश्यकताओं के उपयोग के कारण इमेजन और डीएएल-ई 2 जैसे पिक्सेल-स्पेस प्रसार मॉडल को मात देने का दावा करता है। एक पाठ संकेत के आधार पर चित्र टोकनों को क्रमिक रूप से पुन: नमूना करना, मॉडल एक मुफ्त शून्य-शॉट, मुखौटा-मुक्त संपादन का उत्पादन करता है।

अन्य मॉडलों की तुलना में, विचार के अनुसार, संग्रहालय में तेजी से अनुमान का समय है सरस्वती.

आदर्श संकल्प अनुमान समय (↓)
स्थिर प्रसार 1.4 512 × 512 3.7s
पार्टी-3बी 256 × 256 6.4s
छवि 256 × 256 9.1s
छवि 1024 × 1024 13.3s
सरस्वती -3 बी 256 × 256 0.5s
सरस्वती -3 बी 512 × 512 1.3s

विचार समानांतर डिकोडिंग को नियोजित करता है, जो कि पार्टी और अन्य ऑटोरेग्रेसिव मॉडल से गायब है। एक एलएलएम के साथ जिसे पहले ही प्रशिक्षित किया जा चुका है, भाषा को बारीक स्तर पर समझना संभव है, जो बदले में उच्च-गुणवत्ता वाली छवियों का उत्पादन करने और वस्तुओं, उनके स्थानिक संबंधों, रुख, कार्डिनैलिटी, और इसी तरह की दृश्य अवधारणाओं को पहचानने में अनुवाद करता है। इसके अलावा, संग्रहालय मॉडल को फ्लिप या फ्लिप किए बिना इनपेंटिंग, आउटपेंटिंग और मास्क-मुक्त संपादन की अनुमति देता है।

Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती)

Google सरस्वती एआई सुविधाएँ

म्यूज़ एक तेज़, अत्याधुनिक टेक्स्ट-टू-इमेज जनरेशन और एडिटिंग मॉडल है जिसमें बहुत कुछ है:

  • टेक्स्ट-टू-इमेज जेनरेशन
    • Google Muse AI पाठ्य इनपुट (1.3 × 512 रिज़ॉल्यूशन के लिए 512s या TPUv0.5 पर 256 × 256 रिज़ॉल्यूशन के लिए 4s) के जवाब में जल्दी से उच्च-गुणवत्ता वाली छवियां बनाता है।
Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती): एक बिल्ली अपने खिलाफ शतरंज का खेल खेल रही है। अति तेज। पुरस्कार विजेता। कैनन कैमरा। 10 मिमी लेंस
  • जीरो-शॉट, मास्क-मुक्त संपादन
    • पाठ संकेत के आधार पर चित्र टोकन के पुनरावृत्त पुन: नमूनाकरण के कारण, Google सरस्वती एआई मॉडल हमें मुफ्त शून्य-शॉट, मुखौटा-मुक्त संपादन प्रदान करता है।
Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती)
  • एक छवि को बदलते समय, मुखौटा-मुक्त संपादन आपको एक साधारण पाठ संकेत के साथ कई वस्तुओं में हेरफेर करने की अनुमति देता है।
Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती)
  • जीरो-शॉट इनपेंटिंग / आउटपेंटिंग
    • Google Muse AI में मास्क-आधारित संपादन (इनपेंटिंग/आउटपेंटिंग) मुफ्त में शामिल है। मास्क का उपयोग करते समय, संपादन पीढ़ी के समान ही होता है।
Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती)

Google Muse AI मॉडल विवरण

नीचे आप Google Muse AI की प्रशिक्षण पाइपलाइन पाते हैं:

Google Muse AI क्या है और यह उदाहरणों के साथ कैसे काम करता है? Google की विशेषताओं के द्वारा Muse सीखें और AI दुनिया का अन्वेषण करें।
छवि सौजन्य (सरस्वती)

Google टीम दो अलग-अलग VQGAN टोकननाइज़र नेटवर्क का उपयोग करती है, एक निम्न-गुणवत्ता वाली फ़ोटो के लिए और एक उच्च-रिज़ॉल्यूशन वाली छवियों के लिए। मास्क किए गए टोकन की भविष्यवाणी करने के लिए कम-रिज़ॉल्यूशन ("बेस") और उच्च-रिज़ॉल्यूशन ("सुपरर्स") ट्रांसफॉर्मर को प्रशिक्षित करने के लिए अनमास्क टोकन और टी 5 टेक्स्ट एम्बेडिंग का उपयोग किया जाता है।

Google Muse AI के बारे में अधिक विस्तृत जानकारी के लिए, क्लिक करें यहाँ उत्पन्न करें.


क्या आप सोच रहे हैं कि साइबरपंक शैली में आपका कमरा कैसा होगा? प्रयत्न इंडोर ए.आई.


अन्य एआई उपकरण जिनकी हमने समीक्षा की है

हमने पहले ही कुछ बेहतरीन AI टूल्स के बारे में बताया है मेटा की गैलेक्टिका एआई, धारणा एआईचाय, नोवेलएआईChatGPTकैक्टस एआईउबेरडक एआईमूवी एआईवीडियो बनाओ, तथा एआई डंगऑन. क्या आप जानते हैं कि एआई आर्ट रोबोट भी हैं? जाँचें ऐ-दा.

क्या आप एआई छवि निर्माण में हैं? आप इन टूल्स को आजमा सकते हैं:

एआई शब्दजाल से डरो मत; हमने एक विस्तृत . बनाया है एआई शब्दावली सबसे अधिक इस्तेमाल के लिए कृत्रिम बुद्धि शब्द और समझाओ कृत्रिम बुद्धि की मूल बातें के रूप में अच्छी तरह के रूप में कृत्रिम बुद्धि के जोखिम और लाभ.

समय टिकट:

से अधिक डाटाकॉनॉमी