Google দাবি করেছে যে Muse AI DALL-E 2-এর থেকে ভাল

Google দাবি করেছে যে Muse AI DALL-E 2-এর থেকে ভাল

উত্স নোড: 1867490

Google Muse AI হল টেক জায়ান্ট থেকে সাম্প্রতিক AI টুলের একটি ঝাঁক যা আমরা ইদানীং দেখছি। নতুন টেক্সট-টু-ইমেজ ট্রান্সফরমার মডেলটি প্রতিযোগী পদ্ধতির চেয়ে দ্রুত বলে দাবি করে, কারণ এটি সমান্তরাল ডিকোডিং এবং একটি কমপ্যাক্ট, বিচ্ছিন্ন সুপ্ত স্থান ব্যবহার করে। এর ডেভেলপারদের মতে, গুগল মিউজ এআই অত্যাধুনিক ইমেজ জেনারেশন পারফরম্যান্সে ছবি তৈরি করতে পারে।

আমরা হাজির আবেশ, একটি টেক্সট-টু-ইমেজ ট্রান্সফরমার মডেল যা অত্যাধুনিক ইমেজ জেনারেশন পারফরম্যান্স অর্জন করে যখন ডিফিউশন বা অটোরিগ্রেসিভ মডেলের তুলনায় উল্লেখযোগ্যভাবে বেশি দক্ষ।

গুগল মিউজ এআই টিম

গুগল মিউজ এআই কি?

Google Muse AI হল পূর্বের টেক্সট-টু-ইমেজ ট্রান্সফরমার মডেল যেমন Imagen এবং DALL-E 2 এর একটি কথিত উন্নত সংস্করণ। মিউজকে একটি প্রাক-প্রশিক্ষিত বৃহৎ ভাষা মডেল থেকে অর্জিত টেক্সট এমবেডিং ব্যবহার করে বিচ্ছিন্ন টোকেন স্পেসে একটি মুখোশযুক্ত মডেলিং টাস্কে প্রশিক্ষণ দেওয়া হয়। (এলএলএম)।

গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ): কমলা রঙের বিনি এবং সানগ্লাস পরা একটি তুলতুলে হ্যামস্টারের একটি উচ্চ-কন্ট্রাস্ট পোর্ট্রেট ফটো যাতে লেখা একটি চিহ্ন রয়েছে যেটিতে লেখা আছে

নির্বিচারে অস্পষ্ট করা ছবিগুলিতে টোকেন সনাক্ত করার জন্য মিউজকে প্রশিক্ষণ দেওয়া হয়েছে। বিচ্ছিন্ন টোকেন ব্যবহার এবং ছোট নমুনা আকারের প্রয়োজনীয়তার কারণে ইমেজেন এবং DALL-E 2 এর মতো পিক্সেল-স্পেস ডিফিউশন মডেলগুলিকে ছাড়িয়ে যাওয়ার দাবি মিউজ। একটি টেক্সট প্রম্পটের উপর ভিত্তি করে পুনরাবৃত্তিমূলকভাবে ছবির টোকেনগুলি পুনরায় নমুনা করে, মডেলটি একটি বিনামূল্যে শূন্য-শট, মাস্ক-মুক্ত সম্পাদনা তৈরি করে।

অন্যান্য মডেলের সাথে তুলনা করলে, মিউজের দ্রুত অনুমান সময় আছে, অনুযায়ী আবেশ.

মডেল সমাধান অনুমান সময় (↓)
স্থিতিশীল বিস্তার 1.4 512 × 512 3.7s
পার্টী-৩বি 256 × 256 6.4s
ছবি 256 × 256 9.1s
ছবি 1024 × 1024 13.3s
Muse-3B 256 × 256 0.5s
Muse-3B 512 × 512 1.3s

মিউজ সমান্তরাল ডিকোডিং নিযুক্ত করে, যা পার্টি এবং অন্যান্য অটোরিগ্রেসিভ মডেল থেকে অনুপস্থিত। একটি এলএলএম যা ইতিমধ্যেই প্রশিক্ষিত হয়েছে, এটি একটি দানাদার স্তরে ভাষাকে উপলব্ধি করা সম্ভব, যা ফলস্বরূপ উচ্চ-মানের চিত্র তৈরি করতে এবং বস্তু, তাদের স্থানিক সম্পর্ক, অবস্থান, মূলত্ব ইত্যাদির মতো চাক্ষুষ ধারণাগুলিকে স্বীকৃতি দেয়। আরও, Muse মডেলটিকে ফ্লিপ বা ফ্লিপ না করেই পেইন্টিং, আউটপেইন্টিং এবং মাস্ক-মুক্ত সম্পাদনার অনুমতি দেয়।

গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ)

গুগল মিউজ এআই বৈশিষ্ট্য

মিউজ হল একটি দ্রুত, অত্যাধুনিক টেক্সট-টু-ইমেজ জেনারেশন এবং এডিটিং মডেল যার অফার করার মতো অনেক কিছু রয়েছে:

  • টেক্সট থেকে ইমেজ জেনারেশন
    • Google Muse AI দ্রুত টেক্সচুয়াল ইনপুটগুলির প্রতিক্রিয়া হিসাবে উচ্চ-মানের ছবি তৈরি করে (1.3×512 রেজোলিউশনের জন্য 512s বা TPUv0.5 এ 256×256 রেজোলিউশনের জন্য 4s)।
গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ): একটি বিড়াল নিজের বিরুদ্ধে দাবা খেলা খেলছে। হাইপার শার্প। পুরস্কার বিজয়ী। ক্যানন ক্যামেরা। 10 মিমি লেন্স
  • জিরো-শট, মাস্ক-মুক্ত সম্পাদনা
    • একটি টেক্সট প্রম্পটের উপর ভিত্তি করে ছবির টোকেনগুলির পুনরাবৃত্তিমূলক পুনঃনমুনাকরণের কারণে, Google Muse AI মডেল আমাদের বিনামূল্যে জিরো-শট, মাস্ক-মুক্ত সম্পাদনা প্রদান করে।
গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ)
  • একটি চিত্র পরিবর্তন করার সময়, মুখোশ-মুক্ত সম্পাদনা আপনাকে একটি সাধারণ পাঠ্য প্রম্পট সহ বেশ কয়েকটি অবজেক্ট ম্যানিপুলেট করতে দেয়।
গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ)
  • জিরো-শট ইনপেইন্টিং/আউটপেইন্টিং
    • Google Muse AI-তে মাস্ক-ভিত্তিক সম্পাদনা (ইনপেইন্টিং/আউটপেইন্টিং) বিনামূল্যে অন্তর্ভুক্ত করা হয়েছে। একটি মুখোশ ব্যবহার করার সময়, সম্পাদনা একটি প্রজন্মের মতই।
গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ)

Google Muse AI মডেলের বিবরণ

নীচে আপনি Google Muse AI এর প্রশিক্ষণ পাইপলাইন খুঁজে পাবেন:

গুগল মিউজ এআই কী এবং এটি উদাহরণের সাথে কীভাবে কাজ করে? Google এর বৈশিষ্ট্যগুলির দ্বারা মিউজ শিখুন এবং এআই বিশ্ব অন্বেষণ করুন৷
ছবি সৌজন্যে (আবেশ)

Google টিম দুটি পৃথক VQGAN টোকেনাইজার নেটওয়ার্ক ব্যবহার করে, একটি নিম্ন-মানের ফটোর জন্য এবং একটি উচ্চ-রেজোলিউশন ছবির জন্য। মুখোশহীন টোকেন এবং T5 টেক্সট এম্বেডিংগুলি মুখোশযুক্ত টোকেনগুলির পূর্বাভাস দেওয়ার জন্য কম-রেজোলিউশন ("বেস") এবং উচ্চ-রেজোলিউশন ("সুপারেস") ট্রান্সফরমারকে প্রশিক্ষণ দিতে ব্যবহৃত হয়।

Google Muse AI সম্পর্কে আরও বিস্তারিত তথ্যের জন্য, ক্লিক করুন এখানে.


আপনি কি ভাবছেন সাইবারপাঙ্ক স্টাইলে আপনার ঘর কেমন হবে? চেষ্টা করুন ইনডোর এআই


অন্যান্য AI সরঞ্জামগুলি আমরা পর্যালোচনা করেছি

আমরা ইতিমধ্যে কিছু সেরা AI টুলের মত ব্যাখ্যা করেছি Meta's Galactica AI, ধারণা AIচাই, নভেলএআইচ্যাটজিপিটিক্যাকটাস এআইউবারডাক এআইমুভিও এআইমেক-এ-ভিডিও, এবং এআই অন্ধকূপ. আপনি কি জানেন এআই আর্ট রোবটও আছে? চেক আই-দা.

আপনি কি এআই ইমেজ জেনারেশনে আছেন? আপনি এই সরঞ্জামগুলি চেষ্টা করতে পারেন:

এআই জার্গন থেকে ভয় পাবেন না; আমরা একটি বিস্তারিত তৈরি করেছি এআই শব্দকোষ সর্বাধিক ব্যবহৃত জন্য কৃত্রিম বুদ্ধিমত্তা পদ এবং ব্যাখ্যা করুন কৃত্রিম বুদ্ধিমত্তার মৌলিক বিষয় পাশাপাশি কৃত্রিম বুদ্ধিমত্তার ঝুঁকি এবং সুবিধা.

সময় স্ট্যাম্প:

থেকে আরো ডাটাকোনমি