Η Google ισχυρίζεται ότι το Muse AI είναι καλύτερο από το DALL-E 2

Η Google ισχυρίζεται ότι το Muse AI είναι καλύτερο από το DALL-E 2

Κόμβος πηγής: 1867490

Το Google Muse AI είναι το πιο πρόσφατο πρόσθετο από τον τεχνολογικό γίγαντα σε ένα σμήνος εργαλείων AI που βλέπουμε τον τελευταίο καιρό. Το νέο μοντέλο μετασχηματιστή κειμένου σε εικόνα ισχυρίζεται ότι είναι πιο γρήγορο από τις ανταγωνιστικές μεθόδους, επειδή χρησιμοποιεί παράλληλη αποκωδικοποίηση και έναν συμπαγή, διακριτό λανθάνοντα χώρο. Σύμφωνα με τους προγραμματιστές του, το Google Muse AI μπορεί να παράγει εικόνες με κορυφαίες επιδόσεις παραγωγής εικόνων.

Παρουσιάζουμε Μούσα, ένα μοντέλο μετασχηματιστή κειμένου σε εικόνα που επιτυγχάνει κορυφαίες επιδόσεις παραγωγής εικόνας ενώ είναι σημαντικά πιο αποτελεσματικό από τα μοντέλα διάχυσης ή αυτοπαλίνδρομης λειτουργίας.

Ομάδα τεχνητής νοημοσύνης του Google Muse

Τι είναι το Google Muse AI;

Το Google Muse AI είναι μια υποτιθέμενη βελτιωμένη έκδοση προηγούμενων μοντέλων μετασχηματιστών κειμένου σε εικόνα όπως το Imagen και το DALL-E 2. Το Muse εκπαιδεύεται σε μια εργασία μοντελοποίησης με μάσκα σε διακριτό χώρο διακριτικών χρησιμοποιώντας την ενσωμάτωση κειμένου που αποκτήθηκε από ένα προεκπαιδευμένο μοντέλο μεγάλης γλώσσας (LLM).

Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE): Μια φωτογραφία πορτραίτου υψηλής αντίθεσης ενός χνουδωτού χάμστερ που φοράει ένα πορτοκαλί φασόλι και γυαλιά ηλίου κρατώντας μια ταμπέλα που λέει ας ζωγραφίσουμε

Το Muse έχει εκπαιδευτεί να αναγνωρίζει διακριτικά σε εικόνες που έχουν αυθαίρετα κρυφά. Το Muse ισχυρίζεται ότι ξεπερνά τα μοντέλα διάχυσης χώρου pixel, όπως το Imagen και το DALL-E 2, λόγω της χρήσης διακριτών κουπονιών και των απαιτήσεων μικρότερου μεγέθους δείγματος. Επαναληπτικά επαναδειγματοληψία διακριτικών εικόνων με βάση μια προτροπή κειμένου, το μοντέλο παράγει μια δωρεάν επεξεργασία μηδενικής λήψης, χωρίς μάσκα.

Σε σύγκριση με άλλα μοντέλα, το Muse έχει ταχύτερους χρόνους συμπερασμάτων, σύμφωνα με MUSE.

Μοντέλο Ανάλυση Χρόνος συμπερασμάτων (↓)
Σταθερή Διάχυση 1.4 512 × 512 3.7s
Part-3B 256 × 256 6.4s
Εικόνα 256 × 256 9.1s
Εικόνα 1024 × 1024 13.3s
Muse-3B 256 × 256 0.5s
Muse-3B 512 × 512 1.3s

Το Muse χρησιμοποιεί παράλληλη αποκωδικοποίηση, η οποία λείπει από το Parti και άλλα αυτοπαλινδρομικά μοντέλα. Με ένα LLM που έχει ήδη εκπαιδευτεί, είναι δυνατό να κατανοήσετε τη γλώσσα σε ένα λεπτομερές επίπεδο, το οποίο με τη σειρά του μεταφράζεται στην παραγωγή εικόνων υψηλής ποιότητας και στην αναγνώριση οπτικών εννοιών όπως τα αντικείμενα, τις χωρικές τους σχέσεις, τη στάση, την καρδινικότητα κ.λπ. Επιπλέον, το Muse επιτρέπει την εσωτερική ζωγραφική, τη ζωγραφική και την επεξεργασία χωρίς μάσκα χωρίς να χρειάζεται να αναστρέψετε ή να αναστρέψετε το μοντέλο.

Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE)

Λειτουργίες Google Muse AI

Το Muse είναι ένα γρήγορο, υπερσύγχρονο μοντέλο παραγωγής και επεξεργασίας κειμένου σε εικόνα που έχει τόσα πολλά να προσφέρει:

  • Δημιουργία κειμένου σε εικόνα
    • Το Google Muse AI παράγει γρήγορα εικόνες υψηλής ποιότητας ως απόκριση στις εισαγωγές κειμένου (1.3s για ανάλυση 512×512 ή 0.5s για ανάλυση 256×256 στο TPUv4).
Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE): Μια γάτα που παίζει σκάκι ενάντια στον εαυτό της. Υπεραιχμηρό. Βραβευμένη. Κάμερα Canon. φακός 10mm
  • Μηδενική λήψη, επεξεργασία χωρίς μάσκες
    • Λόγω της επαναληπτικής δειγματοληψίας των διακριτικών εικόνων με βάση μια προτροπή κειμένου, το μοντέλο Google Muse AI μάς παρέχει δωρεάν επεξεργασία μηδενικής λήψης, χωρίς μάσκα.
Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE)
  • Όταν αλλάζετε μια εικόνα, η επεξεργασία χωρίς μάσκες σάς επιτρέπει να χειρίζεστε πολλά αντικείμενα με μια απλή προτροπή κειμένου.
Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE)
  • Zero-shot Inpainting/Outpainting
    • Η επεξεργασία βάσει μάσκας (inpainting/outpainting) περιλαμβάνεται δωρεάν στο Google Muse AI. Όταν χρησιμοποιείτε μια μάσκα, η επεξεργασία είναι ίδια με μια γενιά.
Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE)

Λεπτομέρειες μοντέλου Google Muse AI

Παρακάτω θα βρείτε τον εκπαιδευτικό αγωγό του Google Muse AI:

Τι είναι το Google Muse AI και πώς λειτουργεί με παραδείγματα; Μάθετε Muse από τις δυνατότητες της Google και εξερευνήστε τον κόσμο της τεχνητής νοημοσύνης.
Ευγένεια εικόνας (MUSE)

Η ομάδα της Google χρησιμοποιεί δύο ξεχωριστά δίκτυα Tokenizer VQGAN, ένα για φωτογραφίες χαμηλής ποιότητας και ένα για εικόνες υψηλής ανάλυσης. Τα unmasked tokens και οι ενσωματώσεις κειμένου T5 χρησιμοποιούνται για την εκπαίδευση μετασχηματιστών χαμηλής ανάλυσης ("βάση") και υψηλής ανάλυσης ("superres") για την πρόβλεψη των καλυμμένων διακριτικών.

Για πιο λεπτομερείς πληροφορίες σχετικά με το Google Muse AI, κάντε κλικ εδώ.


Αναρωτιέστε πώς θα είναι το δωμάτιό σας σε στυλ cyberpunk; Προσπαθήστε Εσωτερική AI


Άλλα εργαλεία AI που εξετάσαμε

Έχουμε ήδη εξηγήσει μερικά από τα καλύτερα εργαλεία AI όπως Meta's Galactica AI, Έννοια AIΤσάι, NovelAIChatGPTCaktus AIUberduck AIMOVIO AIΚάνε ένα βίντεο, να AI Μπουντρούμι. Γνωρίζετε ότι υπάρχουν επίσης ρομπότ τέχνης AI; Ελεγξε το Αϊ-ντα.

Ασχολείστε με τη δημιουργία εικόνων AI; Μπορείτε να δοκιμάσετε αυτά τα εργαλεία:

Μην φοβάστε την ορολογία της τεχνητής νοημοσύνης. δημιουργήσαμε μια αναλυτική Γλωσσάρι AI για τα πιο συχνά χρησιμοποιούμενα όρους τεχνητής νοημοσύνης και εξηγήστε το βασικά στοιχεία της τεχνητής νοημοσύνης καθώς και η κινδύνους και οφέλη της τεχνητής νοημοσύνης.

Σφραγίδα ώρας:

Περισσότερα από Βασική τεχνολογία