גוגל טוענת ש-Muse AI עדיפה על DALL-E 2

גוגל טוענת ש-Muse AI עדיפה על DALL-E 2

צומת המקור: 1867490

Google Muse AI הוא התוספת האחרונה של ענקית הטכנולוגיה לנחיל של כלי AI שראינו לאחרונה. מודל שנאי הטקסט לתמונה החדש טוען שהוא מהיר יותר משיטות מתחרות, מכיוון שהוא משתמש בפענוח מקביל ובמרחב סמוי סמוי סמוי. לפי המפתחים שלה, Google Muse AI יכול לייצר תמונות בביצועי יצירת תמונות מתקדמים.

אנחנו מציגים מוזה, דגם Transformer של טקסט לתמונה המשיג ביצועי יצירת תמונות מתקדמים תוך כדי יעילות משמעותית יותר מדגמים דיפוזיה או אוטורגרסיביים.

צוות בינה מלאכותית של Google Muse

מה זה Google Muse AI?

Google Muse AI היא גרסה משופרת לכאורה של דגמי שנאי טקסט לתמונה קודמים כמו Imagen ו-DALL-E 2. Muse מאומנת במשימת דוגמנות רעולי פנים במרחב אסימון דיסקרטי באמצעות הטבעת הטקסט שנרכשה ממודל שפה גדול מאומן מראש (LLM).

מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה): תמונת דיוקן בעלת ניגודיות גבוהה של אוגר צמרמורת עם כיפה כתומה ומשקפי שמש מחזיקה שלט שאומר בואו נצבע

מוזה הוכשרה לזהות אסימונים בתמונות שהוסתרו באופן שרירותי. Muse טוענת שהיא מתעלה על דגמי פיזור מרחב פיקסלים כמו Imagen ו-DALL-E 2 בשל השימוש באסימונים נפרדים ודרישות קטנות יותר של גודל מדגם. דגימה חוזרת של אסימוני תמונה בהתבסס על הנחית טקסט, המודל מייצר עריכה חופשית של צילום אפס וללא מסיכה.

בהשוואה לדגמים אחרים, ל-Muse יש זמני מסקנות מהירים יותר, לפי מוזה.

מספר סימוכין החלטה זמן מסקנות (↓)
דיפוזיה יציבה 1.4 512 × 512 3.7s
Parti-3B 256 × 256 6.4s
תמונה 256 × 256 9.1s
תמונה 1024 × 1024 13.3s
Muse-3B 256 × 256 0.5s
Muse-3B 512 × 512 1.3s

Muse משתמשת בפענוח מקביל, שחסר ב-Parti ובדגמים אוטורגרסיביים אחרים. עם LLM שכבר עבר הכשרה, ניתן לתפוס שפה ברמה גרעינית, אשר בתורה מתורגמת להפקת תמונות באיכות גבוהה וזיהוי מושגים ויזואליים כמו אובייקטים, היחסים המרחביים שלהם, עמדתם, הקרדינליות וכו'. יתרה מכך, Muse מאפשרת ציור, צביעה חוץ ועריכה נטולת מסכות ללא צורך להעיף או להפוך את הדגם.

מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה)

תכונות Google Muse AI

Muse הוא מודל מהיר ומתקדם של יצירת טקסט לתמונה ועריכה שיש לו כל כך הרבה מה להציע:

  • יצירת טקסט לתמונה
    • Google Muse AI מייצר במהירות תמונות באיכות גבוהה בתגובה לקלט טקסטואלי (1.3 שניות ברזולוציית 512×512 או 0.5 שניות עבור רזולוציית 256×256 ב-TPUv4).
מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה): חתול משחק נגד עצמו משחק שח. היפר חד. זוכה פרסים. מצלמת קנון. עדשת 10 מ"מ
  • אפס צילום, עריכה ללא מסכות
    • בשל הדגימה החוזרת האיטרטיבית של אסימוני תמונה בהתבסס על הנחית טקסט, מודל ה-Google Muse AI מספק לנו עריכה ללא צילום ללא מסיכה בחינם.
מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה)
  • בעת שינוי תמונה, עריכה ללא מסיכה מאפשרת לך לתפעל מספר אובייקטים באמצעות הנחיה טקסט פשוטה.
מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה)
  • ציור / ציור אפס שוט
    • עריכה מבוססת מסכות (ציור/ציור חוץ) כלולה בחינם ב-Google Muse AI. בעת שימוש במסכה, עריכה זהה לדור.
מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה)

פרטי דגם Google Muse AI

להלן תמצא את צינור ההדרכה של Google Muse AI:

מהו Google Muse AI וכיצד זה עובד עם דוגמאות? למד את התכונות של Muse by Google וחקור את עולם הבינה המלאכותית.
התמונה באדיבות (מוזה)

צוות גוגל משתמש בשתי רשתות VQGAN tokenizer נפרדות, אחת לתמונות באיכות נמוכה ואחת לתמונות ברזולוציה גבוהה. האסימונים הלא-מסוכים והטמעות הטקסט T5 משמשים לאימון שנאים ברזולוציה נמוכה ("בסיס") וברזולוציה גבוהה ("סופררס") כדי לחזות את האסימונים המסוכים.

למידע מפורט יותר על Google Muse AI, לחץ כאן.


האם אתה תוהה איך החדר שלך יהיה בסגנון סייברפאנק? לְנַסוֹת AI מקורה


כלי AI אחרים שסקרנו

כבר הסברנו כמה מכלי הבינה המלאכותית הטובים ביותר כמו Galactica AI של Meta, מושג AIחי, NovelAIChatGPTקקטוס AIUberduck AIMOVIO AIעשה-א-וידאו, ו צינוק AI. האם אתה יודע שיש גם רובוטים לאמנות בינה מלאכותית? בדוק את ה איי-דה.

האם אתה עוסק ביצירת תמונות בינה מלאכותית? אתה יכול לנסות את הכלים הבאים:

אל תפחדו מהז'רגון של AI; יצרנו מפורט מילון מונחים של AI עבור הנפוצים ביותר מונחי בינה מלאכותית ולהסביר את יסודות הבינה המלאכותית כמו גם סיכונים ויתרונות של בינה מלאכותית.

בול זמן:

עוד מ דאטונומיה