Google Muse AI on viimeisin lisäys teknologiajättiläistä viime aikoina nähtyihin tekoälytyökaluihin. Uusi tekstistä kuvaksi muuntajamalli väittää olevansa kilpailevia menetelmiä nopeampi, koska se käyttää rinnakkaisdekoodausta ja kompaktia, diskreettiä piilevää tilaa. Kehittäjiensä mukaan Google Muse AI voi tuottaa kuvia huippuluokan kuvantuotantokyvyllä.
Esitämme Muusa, tekstistä kuvaksi muuntajamalli, joka saavuttaa huippuluokan kuvan luomissuorituskyvyn ja on samalla huomattavasti tehokkaampi kuin diffuusio- tai autoregressiiviset mallit.
Google Muse AI -tiimi
Mikä on Google Muse AI?
Google Muse AI on väitetysti parannettu versio aikaisemmista tekstistä kuvaksi muuntajamalleista, kuten Imagen ja DALL-E 2. Muse on koulutettu maskimallinnustehtävään erillisessä merkkitilassa käyttämällä valmiiksi koulutetusta suuresta kielimallista hankittua tekstin upotusta. (LLM).
Muse on koulutettu tunnistamaan kuvakkeet, jotka on mielivaltaisesti peitetty. Muse väittää ylittävänsä pikseliavaruuden diffuusiomallit, kuten Imagen ja DALL-E 2, koska se käyttää erillisiä tunnisteita ja pienempiä otoskokovaatimuksia. Iteratiivisesti näyttelemällä kuvatunnisteita tekstikehotteen perusteella, malli tuottaa ilmaisen nollakuvan, maskittoman editoinnin.
Muihin malleihin verrattuna Musella on nopeammat päättelyajat MUSE.
Malli | päätöslauselma | Päätelmäaika (↓) |
Vakaa diffuusio 1.4 | 512 × 512 | 3.7s |
Osa 3B | 256 × 256 | 6.4s |
Kuva | 256 × 256 | 9.1s |
Kuva | 1024 × 1024 | 13.3s |
Muse-3B | 256 × 256 | 0.5s |
Muse-3B | 512 × 512 | 1.3s |
Muse käyttää rinnakkaisdekoodausta, joka puuttuu Partista ja muista autoregressiivisistä malleista. Jo koulutetulla LLM:llä on mahdollista tarttua kieleen rakeisella tasolla, mikä puolestaan tarkoittaa korkealaatuisten kuvien tuottamista ja visuaalisten käsitteiden, kuten esineiden, niiden tilasuhteiden, asenteen, kardinaalisuuden ja niin edelleen tunnistamista. Lisäksi Muse mahdollistaa maalaamisen, ulkomaalauksen ja naamiottoman editoinnin ilman, että mallia tarvitsee kääntää.
Google Muse AI -ominaisuudet
Muse on nopea, huippuluokan tekstin kuvaksi luonti- ja muokkausmalli, jolla on niin paljon tarjottavaa:
- Tekstistä kuvaksi luominen
- Google Muse AI tuottaa nopeasti korkealaatuisia kuvia vasteena tekstisyötteisiin (1.3 s 512 × 512 -resoluutiolla tai 0.5 s 256 × 256 -resoluutiolla TPUv4:ssä).
- Nollakuva, maskiton editointi
- Tekstikehotteeseen perustuvan kuvatunnisteiden iteratiivisen uudelleennäytteenoton ansiosta Google Muse AI -malli tarjoaa meille ilmaisen nollakuvan, maskittoman editoinnin.
- Kun muutat kuvaa, maskiton muokkaus mahdollistaa useiden objektien käsittelyn yksinkertaisella tekstikehotteella.
- Zero-shot Inmaalaus/Outmaalaus
- Maskipohjainen muokkaus (inpainting/outpainting) sisältyy ilmaiseksi Google Muse AI:hen. Maskia käytettäessä muokkaus on sama kuin sukupolvi.
Google Muse AI -mallin tiedot
Alta löydät Google Muse AI:n koulutusputken:
Google-tiimi käyttää kahta erillistä VQGAN-tokenizer-verkkoa, toista huonolaatuisille kuville ja toista korkearesoluutioisille kuville. Maskamattomia tunnuksia ja T5-tekstin upotuksia käytetään opettamaan matalaresoluutioisia ("perus") ja korkearesoluutioisia ("superres") muuntajia ennustamaan peitettyjä merkkejä.
Saat lisätietoja Google Muse AI:stä napsauttamalla tätä.
Mietitkö, millainen huoneesi tulee olemaan kyberpunk-tyyliin? Yrittää Sisätilojen tekoäly
Muut tarkistamamme tekoälytyökalut
Olemme jo selittäneet joitain parhaista AI-työkaluista, kuten Metan Galactica AI, Käsite AI, Chai, Lyhyitä tarinoita, ChatGPT, Kaktus AI, Uberduck AI, MOVIO AI, Tehdä videoja AI Dungeon. Tiesitkö, että on olemassa myös tekoälyrobotteja? Tarkista Ai-Da.
Oletko kiinnostunut tekoälykuvan luomisesta? Voit kokeilla näitä työkaluja:
Älä pelkää tekoälysargonia; olemme luoneet yksityiskohtaisen AI sanasto yleisimmin käytetyille tekoälyn termejä ja selittää tekoälyn perusteet sekä tekoälyn riskeistä ja eduista.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. Pääsy tästä.
- Lähde: https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/
- 1
- 7
- a
- Meistä
- Mukaan
- hankittu
- vastaan
- AI
- ai taide
- väitetään
- mahdollistaa
- jo
- ja
- Art
- keinotekoinen
- palkinto
- perustua
- koska
- ovat
- Hyödyt
- PARAS
- Paremmin
- kamera
- KISSA
- tarkastaa
- shakki
- vaatimukset
- luokka
- yleisesti
- verrattuna
- kilpailevien
- käsitteet
- luotu
- Cyberpunk
- dall's
- Dekoodaus
- yksityiskohtainen
- kehittäjille
- Aikaisemmin
- tehokas
- työllistää
- Eetteri (ETH)
- Esimerkit
- Selittää
- selitti
- tutkia
- FAST
- nopeampi
- Ominaisuudet
- Löytää
- Kääntää
- Ilmainen
- alkaen
- edelleen
- peli
- sukupolvi
- jättiläinen
- GitHub
- ymmärtää
- Hamsteri
- ottaa
- korkealaatuisia
- korkea resoluutio
- pito
- Miten
- HTTPS
- tunnistaa
- kuva
- kuvan sukupolvi
- kuvien
- parani
- in
- mukana
- tiedot
- Älykkyys
- IT
- itse
- ammattikieli
- Tietää
- Kieli
- suuri
- uusin
- OPPIA
- Taso
- naamio
- menetelmät
- puuttuva
- malli
- mallintaminen
- mallit
- lisää
- tehokkaampi
- eniten
- MUSE
- verkot
- Uusi
- esineet
- hämärtyy
- kampanja
- ONE
- Oranssi
- Muut
- suoriutua paremmin kuin
- Parallel
- suorituskyky
- kuva
- putki
- Platon
- Platonin tietotieto
- PlatonData
- pelaa
- muotokuva
- mahdollinen
- ennustaa
- tuottaa
- tarjoaa
- nopeammin
- nopeasti
- Ihmissuhteet
- vaatimukset
- päätöslauselma
- vastaus
- robotit
- Huone
- sama
- pelottaa
- koska
- useat
- merkki
- merkittävästi
- Yksinkertainen
- Koko
- pienempiä
- So
- jonkin verran
- Tila
- tila-
- huippu-
- tyyli
- Parvi
- Tehtävä
- joukkue-
- teknologia
- -
- heidän
- aika
- kertaa
- että
- symbolinen
- tokens
- työkalut
- Juna
- koulutettu
- koulutus
- muuntajat
- VUORO
- us
- Käyttö
- versio
- Mitä
- Mikä on
- joka
- vaikka
- tulee
- voittaa
- ilman
- Mietitkö
- Referenssit
- maailman-
- Sinun
- zephyrnet