Google susține că Muse AI este mai bun decât DALL-E 2

Google susține că Muse AI este mai bun decât DALL-E 2

Nodul sursă: 1867490

Google Muse AI este cea mai recentă completare de la gigantul tehnologic la un roi de instrumente AI pe care le-am văzut în ultima vreme. Noul model de transformator text-to-image pretinde a fi mai rapid decât metodele concurente, deoarece folosește decodare paralelă și un spațiu latent compact și discret. Potrivit dezvoltatorilor săi, Google Muse AI poate produce imagini la performanțe de generare de imagini de ultimă generație.

Vă prezentăm Muse, un model de transformare text-to-image care realizează performanțe de generare de imagini de ultimă generație, fiind în același timp semnificativ mai eficient decât modelele de difuzie sau autoregresive.

Echipa Google Muse AI

Ce este Google Muse AI?

Google Muse AI este o versiune presupusă îmbunătățită a modelelor anterioare de transformare text-to-image, cum ar fi Imagen și DALL-E 2. Muse este antrenat pentru o sarcină de modelare mascata într-un spațiu de simboluri discret, folosind încorporarea textului dobândită dintr-un model de limbaj mare pre-antrenat. (LLM).

Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză): O fotografie portret cu contrast ridicat cu un hamster pufos purtând o căciulă portocalie și ochelari de soare ținând o pancartă pe care scrie să pictăm

Muse a fost instruit să identifice jetoane în imagini care au fost ascunse în mod arbitrar. Muse pretinde că depășește modelele de difuzie în spațiu de pixeli, cum ar fi Imagen și DALL-E 2, datorită utilizării sale de jetoane discrete și a cerințelor de dimensiune mai mică a eșantionului. Reeșantionând în mod iterativ jetoanele de imagine pe baza unui prompt text, modelul produce o editare gratuită, fără masca.

În comparație cu alte modele, Muse are timpi de inferență mai rapizi, potrivit Muză.

Model Rezoluţie Timp de inferență (↓)
Difuziune stabilă 1.4 512 × 512 Anii 3.7
Parti-3B 256 × 256 Anii 6.4
Imagine 256 × 256 Anii 9.1
Imagine 1024 × 1024 Anii 13.3
Muza-3B 256 × 256 Anii 0.5
Muza-3B 512 × 512 Anii 1.3

Muse folosește decodare paralelă, care lipsește din Parti și din alte modele autoregresive. Cu un LLM care a fost deja instruit, este posibil să înțelegem limbajul la un nivel granular, care, la rândul său, se traduce prin producerea de imagini de înaltă calitate și recunoașterea conceptelor vizuale precum obiectele, relațiile lor spațiale, poziția, cardinalitatea și așa mai departe. În plus, Muse permite încorporarea, desenarea și editarea fără mască fără a fi nevoie să răstoarne sau să răstoarne modelul.

Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză)

Funcții Google Muse AI

Muse este un model de generare și editare text-to-imagine rapid, de ultimă generație, care are atât de multe de oferit:

  • Generare text în imagine
    • Google Muse AI produce rapid imagini de înaltă calitate ca răspuns la intrările de text (1.3 s pentru rezoluția 512×512 sau 0.5 s pentru rezoluția 256×256 pe TPUv4).
Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză): O pisică care joacă un joc de șah împotriva sa. Super ascuțit. Câștigător de premii. Camera Canon. obiectiv de 10 mm
  • Editare zero-shot, fără mască
    • Datorită reeșantionării iterative a jetoanelor de imagine pe baza unei solicitări de text, modelul Google Muse AI ne oferă o editare gratuită cu zero-shot, fără mască.
Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză)
  • Când modificați o imagine, editarea fără mască vă permite să manipulați mai multe obiecte cu un simplu mesaj text.
Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză)
  • Zero-shot Inpainting/Outpainting
    • Editarea pe bază de mască (inpainting/outpainting) este inclusă gratuit în Google Muse AI. Când utilizați o mască, editarea este la fel ca o generație.
Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză)

Detalii model Google Muse AI

Mai jos găsiți canalul de instruire Google Muse AI:

Ce este Google Muse AI și cum funcționează cu exemple? Aflați funcțiile Muse by Google și explorați lumea AI.
Imagini de curtoazie (Muză)

Echipa Google folosește două rețele separate de tokenizer VQGAN, una pentru fotografii de calitate scăzută și una pentru imagini de înaltă rezoluție. Jetoanele demascate și încorporarea textului T5 sunt folosite pentru a antrena transformatoare de rezoluție joasă („bază”) și de înaltă rezoluție („superres”) pentru a prezice jetoanele mascate.

Pentru informații mai detaliate despre Google Muse AI, faceți clic aici.


Te întrebi cum va fi camera ta în stil cyberpunk? Încerca AI de interior


Alte instrumente AI pe care le-am revizuit

Am explicat deja unele dintre cele mai bune instrumente AI, cum ar fi Galactica AI al lui Meta, Noțiunea AIChai, RomanAIChat GPTCactus AIUberduck AIFILM AIFaceți un videoclip, și AI Dungeon. Știți că există și roboți de artă AI? Verifică El-Da.

Sunteți interesat de generarea de imagini AI? Puteți încerca aceste instrumente:

Nu vă speriați de jargonul AI; am creat un detaliat Glosar AI pentru cele mai frecvent utilizate termeni de inteligență artificială și explicați elementele de bază ale inteligenței artificiale precum şi riscurile și beneficiile inteligenței artificiale.

Timestamp-ul:

Mai mult de la Economia datelor