Google Muse AI er det siste tillegget fra teknologigiganten til en sverm av AI-verktøy vi har sett i det siste. Den nye tekst-til-bilde-transformatormodellen hevder å være raskere enn konkurrerende metoder, fordi den bruker parallell dekoding og et kompakt, diskret latent rom. Ifølge utviklerne kan Google Muse AI produsere bilder med toppmoderne bildegenereringsytelse.
Vi presenterer Muse, en tekst-til-bilde transformatormodell som oppnår toppmoderne bildegenereringsytelse samtidig som den er betydelig mer effektiv enn diffusjons- eller autoregressive modeller.
Google Muse AI-team
Hva er Google Muse AI?
Google Muse AI er en angivelig forbedret versjon av tidligere tekst-til-bilde-transformatormodeller som Imagen og DALL-E 2. Muse trenes på en maskert modelleringsoppgave i diskret token-rom ved å bruke tekstinnbyggingen hentet fra en forhåndstrent stor språkmodell (LLM).
Muse har blitt opplært til å identifisere tokens i bilder som har blitt vilkårlig skjult. Muse hevder å overgå pixel-space diffusjonsmodeller som Imagen og DALL-E 2 på grunn av bruken av diskrete tokens og krav til mindre prøvestørrelse. Iterativt resampling av bildetokens basert på en tekstmelding, produserer modellen en gratis null-shot, maskefri redigering.
Sammenlignet med andre modeller har Muse raskere slutningstider, ifølge MUSE.
Modell | oppløsning | Inferenstid (↓) |
Stabil diffusjon 1.4 | 512 × 512 | 3.7s |
Parti-3B | 256 × 256 | 6.4s |
Bilde | 256 × 256 | 9.1s |
Bilde | 1024 × 1024 | 13.3s |
Muse-3B | 256 × 256 | 0.5s |
Muse-3B | 512 × 512 | 1.3s |
Muse bruker parallell dekoding, som mangler fra Parti og andre autoregressive modeller. Med en LLM som allerede er trent, er det mulig å forstå språk på et granulært nivå, som igjen betyr å produsere bilder av høy kvalitet og gjenkjenne visuelle konsepter som objekter, deres romlige forhold, holdning, kardinalitet og så videre. Videre tillater Muse innpainting, outpainting og maskefri redigering uten å måtte snu eller snu modellen.
Google Muse AI-funksjoner
Muse er en rask, toppmoderne tekst-til-bilde generering og redigeringsmodell som har så mye å tilby:
- Tekst-til-bilde generering
- Google Muse AI produserer raskt bilder av høy kvalitet som svar på tekstinndata (1.3s for 512×512 oppløsning eller 0.5s for 256×256 oppløsning på TPUv4).
- Null-shot, maskefri redigering
- På grunn av den iterative resamplingen av bildetokens basert på en tekstmelding, gir Google Muse AI-modellen oss gratis null-shot, maskefri redigering.
- Når du endrer et bilde, lar maskefri redigering deg manipulere flere objekter med en enkel tekstmelding.
- Zero-shot Inpainting/Outpainting
- Maskebasert redigering (inpainting/outpainting) er inkludert gratis i Google Muse AI. Når du bruker en maske, er redigering det samme som en generasjon.
Google Muse AI-modelldetaljer
Nedenfor finner du treningspipeline til Google Muse AI:
Google-teamet bruker to separate VQGAN tokenizer-nettverk, ett for bilder av lav kvalitet og ett for bilder med høy oppløsning. De demaskerte tokenene og T5-tekstinnbyggingene brukes til å trene transformatorer med lav oppløsning ("base") og høyoppløselig ("superres") for å forutsi de maskerte tokenene.
For mer detaljert informasjon om Google Muse AI, klikk her..
Lurer du på hvordan rommet ditt blir i cyberpunk-stil? Prøve Innendørs AI
Andre AI-verktøy vi har gjennomgått
Vi har allerede forklart noen av de beste AI-verktøyene som Metas Galactica AI, Forestillingen AI, Chai, Noveller, ChatGPT, Kaktus AI, Uberduck AI, MOVIO AI, Lag en videoog AI Dungeon. Vet du at det også finnes AI-kunstroboter? Undersøk Ai-Da.
Er du interessert i AI-bildegenerering? Du kan prøve disse verktøyene:
Ikke vær redd for AI-sjargong; vi har laget en detaljert AI-ordliste for de mest brukte termer for kunstig intelligens og forklare grunnleggende om kunstig intelligens samt risikoer og fordeler ved kunstig intelligens.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/
- 1
- 7
- a
- Om oss
- Ifølge
- ervervet
- mot
- AI
- ai kunst
- angivelig
- tillater
- allerede
- og
- Kunst
- kunstig
- award
- basert
- fordi
- være
- Fordeler
- BEST
- Bedre
- rom
- CAT
- sjekk
- Sjakk
- krav
- klasse
- vanligvis
- sammenlignet
- konkurrerende
- konsepter
- opprettet
- cyberpunk
- dall sin
- Dekoding
- detaljert
- utviklere
- Tidligere
- effektiv
- anvender
- Eter (ETH)
- eksempler
- Forklar
- forklarte
- utforske
- FAST
- raskere
- Egenskaper
- Finn
- Flip
- Gratis
- fra
- videre
- spill
- generasjonen
- giganten
- GitHub
- gripe
- Hamster
- å ha
- høykvalitets
- høy oppløsning
- holder
- Hvordan
- HTTPS
- identifisere
- bilde
- bildegenerering
- bilder
- forbedret
- in
- inkludert
- informasjon
- Intelligens
- IT
- selv
- sjargong
- Vet
- Språk
- stor
- siste
- LÆRE
- Nivå
- maske
- metoder
- mangler
- modell
- modellering
- modeller
- mer
- mer effektivt
- mest
- MUSE
- nettverk
- Ny
- gjenstander
- skjult
- tilby
- ONE
- oransje
- Annen
- outperform
- Parallel
- ytelse
- bilde
- rørledning
- plato
- Platon Data Intelligence
- PlatonData
- spiller
- portrett
- mulig
- forutsi
- produsere
- gir
- raskere
- raskt
- Relasjoner
- Krav
- oppløsning
- svar
- roboter
- rom
- samme
- redd
- se
- flere
- undertegne
- betydelig
- Enkelt
- Størrelse
- mindre
- So
- noen
- Rom
- romlig
- state-of-the-art
- stil
- Swarm
- Oppgave
- lag
- tech
- De
- deres
- tid
- ganger
- til
- token
- tokens
- verktøy
- Tog
- trent
- Kurs
- transformers
- SVING
- us
- bruk
- versjon
- Hva
- Hva er
- hvilken
- mens
- vil
- vinne
- uten
- lurer
- Arbeid
- verden
- Din
- zephyrnet