Google hevder at Muse AI er bedre enn DALL-E 2

Publisert av Platon

Følgere: 0

Google Muse AI er det siste tillegget fra teknologigiganten til en sverm av AI-verktøy vi har sett i det siste. Den nye tekst-til-bilde-transformatormodellen hevder å være raskere enn konkurrerende metoder, fordi den bruker parallell dekoding og et kompakt, diskret latent rom. Ifølge utviklerne kan Google Muse AI produsere bilder med toppmoderne bildegenereringsytelse.

Vi presenterer Muse, en tekst-til-bilde transformatormodell som oppnår toppmoderne bildegenereringsytelse samtidig som den er betydelig mer effektiv enn diffusjons- eller autoregressive modeller.

Google Muse AI-team

Hva er Google Muse AI?

Google Muse AI er en angivelig forbedret versjon av tidligere tekst-til-bilde-transformatormodeller som Imagen og DALL-E 2. Muse trenes på en maskert modelleringsoppgave i diskret token-rom ved å bruke tekstinnbyggingen hentet fra en forhåndstrent stor språkmodell (LLM).

Muse har blitt opplært til å identifisere tokens i bilder som har blitt vilkårlig skjult. Muse hevder å overgå pixel-space diffusjonsmodeller som Imagen og DALL-E 2 på grunn av bruken av diskrete tokens og krav til mindre prøvestørrelse. Iterativt resampling av bildetokens basert på en tekstmelding, produserer modellen en gratis null-shot, maskefri redigering.

Sammenlignet med andre modeller har Muse raskere slutningstider, ifølge MUSE.

Modell	oppløsning	Inferenstid (↓)
Stabil diffusjon 1.4	512 × 512	3.7s
Parti-3B	256 × 256	6.4s
Bilde	256 × 256	9.1s
Bilde	1024 × 1024	13.3s
Muse-3B	256 × 256	0.5s
Muse-3B	512 × 512	1.3s

Muse bruker parallell dekoding, som mangler fra Parti og andre autoregressive modeller. Med en LLM som allerede er trent, er det mulig å forstå språk på et granulært nivå, som igjen betyr å produsere bilder av høy kvalitet og gjenkjenne visuelle konsepter som objekter, deres romlige forhold, holdning, kardinalitet og så videre. Videre tillater Muse innpainting, outpainting og maskefri redigering uten å måtte snu eller snu modellen.

Google Muse AI-funksjoner

Muse er en rask, toppmoderne tekst-til-bilde generering og redigeringsmodell som har så mye å tilby:

Tekst-til-bilde generering
- Google Muse AI produserer raskt bilder av høy kvalitet som svar på tekstinndata (1.3s for 512×512 oppløsning eller 0.5s for 256×256 oppløsning på TPUv4).

Null-shot, maskefri redigering
- På grunn av den iterative resamplingen av bildetokens basert på en tekstmelding, gir Google Muse AI-modellen oss gratis null-shot, maskefri redigering.

Når du endrer et bilde, lar maskefri redigering deg manipulere flere objekter med en enkel tekstmelding.

Zero-shot Inpainting/Outpainting
- Maskebasert redigering (inpainting/outpainting) er inkludert gratis i Google Muse AI. Når du bruker en maske, er redigering det samme som en generasjon.

Google Muse AI-modelldetaljer

Nedenfor finner du treningspipeline til Google Muse AI:

Google-teamet bruker to separate VQGAN tokenizer-nettverk, ett for bilder av lav kvalitet og ett for bilder med høy oppløsning. De demaskerte tokenene og T5-tekstinnbyggingene brukes til å trene transformatorer med lav oppløsning ("base") og høyoppløselig ("superres") for å forutsi de maskerte tokenene.

For mer detaljert informasjon om Google Muse AI, klikk her..

Lurer du på hvordan rommet ditt blir i cyberpunk-stil? Prøve Innendørs AI

Andre AI-verktøy vi har gjennomgått

Vi har allerede forklart noen av de beste AI-verktøyene som Metas Galactica AI, Forestillingen AI, Chai, Noveller, ChatGPT, Kaktus AI, Uberduck AI, MOVIO AI, Lag en videoog AI Dungeon. Vet du at det også finnes AI-kunstroboter? Undersøk Ai-Da.

Er du interessert i AI-bildegenerering? Du kan prøve disse verktøyene:

Ikke vær redd for AI-sjargong; vi har laget en detaljert AI-ordliste for de mest brukte termer for kunstig intelligens og forklare grunnleggende om kunstig intelligens samt risikoer og fordeler ved kunstig intelligens.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
kilde: https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

Tidstempel: Januar 4, 2023

Tidstempel: Desember 30, 2022

Mikrofonen din kan være hackernes beste venn, sier studie

Kildeklynge:

Datakonomi

Kilde node: 2200095

Tidstempel: August 7, 2023

Du kan ikke oppnå perfeksjon med en feil start

Kildeklynge:

Datakonomi

Kilde node: 2186647

Tidstempel: Juli 27, 2023

Google hevder at Muse AI er bedre enn DALL-E 2

Publisert av Platon

Hva er Google Muse AI?

Google Muse AI-funksjoner

Google Muse AI-modelldetaljer

Andre AI-verktøy vi har gjennomgått

Mer fra Datakonomi

Dopple AI gjør fiktive samtaler til virkelighet

Whisper v3: Revolusjonerende talegjenkjenning og mer

Xaira sikrer et milliardspill på fremtiden for oppdagelse av AI-medisin

Den første oppgaven til Helldivers 2 er å lære å bli med på serverne

Du kan ikke opphavsrettsbeskytte AI-genererte verk, sier US Federal Judge

Google bygger et datasenter på 1 milliard dollar i Kansas City

Mikrofonen din kan være hackernes beste venn, sier studie

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn