משחקי האמנות Genie AI של גוגל מ-Single Images

משחקי היצירה Genie AI של גוגל מ-Single Images

צומת המקור: 2500380

גוגל הכריזה על Genie, אפליקציה לייצור משחקים למובייל, כחלק מההשקעה השוטפת שלה בבינה מלאכותית. 

מודל ה-AI הגנרטיבי Genie, שפותח על ידי סטארט-אפ הבינה המלאכותית של גוגל, DeepMind, הדגים הדגמה חיה. Genie לומד מכניקת משחק ממאות אלפי סרטוני משחק ויכול ליצור משחקים ניתנים להפעלה במינימום הנחיות.

גם לקרוא: איור בינה מלאכותית כדי לגייס 675 מיליון דולר עבור רובוטיקה אנושית לפתרון עבודה

חושפת את ג'יני

כפי שנאמר ב-DeepMind הרשמי של גוגל בלוג, Genie הוא מודל עולמי בסיסי שהוכשר באמצעות סרטונים מקוונים. "מגוון אינסופי של עולמות הניתנים להפעלה (הניתנים לשליטה בפעולה) מתמונות סינתטיות, תצלומים ואפילו סקיצות" יכול להיות מופק על ידי הדוגמנית.

Genie, קיצור של Generative Interactive Environments, פותחה בשותפות בין גוגל ואוניברסיטת בריטיש קולומביה. עם תמונה אחת בלבד, הוא יכול ליצור פלטפורמות דו-ממדיות עם גלילה צדדיות כגון Contra ו-Super Mario Brothers בהתבסס על הנחיות משתמש.

עם זאת, גוגל DeepMind הצהירה במהלך ההכרזה כי היא מציגה "פרדיגמה חדשה" לבינה מלאכותית (AI) בדמות Genie. בנוסף, החברה הכירה בהופעתם של דגמי AI גנרטיביים המסוגלים לייצר תוכן חדשני ויצירתי באמצעות שפה, תמונות ואפילו סרטונים.

לפי גוגל, חלק ניכר מ-200,000 השעות של סרטוני משחקי אינטרנט ציבוריים ללא פיקוח עליהם ג'יני הוכשרה הם פלטפורמות דו-ממדיות ולא משחקי מציאות מדומה מלאים.

המפרט של ג'יני

בכל הנוגע למידות, Genie עומד על 11 מיליארד פרמטרים. אסימון וידאו מרחבי-זמני, מודל דינמיקה אוטורגרסיבית ומודל פעולה סמויה פשוט וניתן להרחבה כלולים במודל. מפרטים אלו מאפשרים ל-Genie לפעול בסביבות שנוצרו מסגרת-אחר-מסגרת, אפילו ללא תוויות או דרישות אחרות ספציפיות לתחום בעת אימון.

בנוסף, ניתן להנחות את Genie ליצור קבוצה מגוונת של סביבות אינטראקטיביות וניתנות לשליטה, למרות הדרכה על נתונים ווידאו בלבד. Genie יכול ליצור סביבות ניתנות להפעלה עם בקשת תמונה אחת בלבד, בניגוד לדגמי AI גנרטיביים רבים שיכולים לייצר תוכן יצירתי עם תמונות בשפה ואפילו סרטונים.

עם זאת, מפתח Google DeepMind Tim Rocktäschel אמר ב-X (לשעבר טוויטר) שהם מתמקדים בקנה מידה ולא בהוספת הטיות אינדוקטיביות.

הוא הוסיף שהם משתמשים במערך נתונים של למעלה מ-200 אלף שעות של סרטונים מפלטפורמות דו-ממדיות ומאמנים מודל עולמי של 2B. בדרך ללא פיקוח, ג'יני לומדת פעולות סמויות מגוונות השולטות באופן עקבי בדמויות.

משחקי האמנות Genie AI של גוגל מ-Single Images
קרדיט תמונות: גוגל

היכולות של ג'יני

לפי Google חוקרים, Genie מונע על ידי שלושה מודלים: מודל דינמי שמנבא מה יקרה בפריים הבא, טוקניר וידאו שהופך פריימים וידאו גולמיים לאסימונים נפרדים, ומודל פעולה סמוי שיכול להסיק את הפעולות בין פריימים של וידאו.

היכולת של המודל הבסיסי של Genie לזהות את הדמות הראשית של המשחק מבלי להיות מאומן על פעולה או הערות טקסט היא אחת התכונות הייחודיות שלו. הודות לדגמים המניעים אותו, המשתמש יכול לשלוט בדמות ללא מאמץ שנוצר AI סביבת מציאות מדומה.

Rocktäschel גם אמר שג'יני יכול להפוך מדיה אחרת למשחקים. ניתן לבקש מ-Genie ליצור עולמות וירטואליים שונים הניתנים לשליטה בפעולה מתוך תשומות שונות במאמר המחקר הנלווה של Google DeepMind.

יתר על כן, Rocktäschel אמר שהמודל יכול להמיר כל תמונה לעולם דו-ממדי שניתן לשחק בו. לדבריו, ג'יני יכולה להביא לחיים יצירות בעיצוב אנושי כמו סקיצות, למשל, יצירות אמנות יפהפיות של סנקה וכספיאן, שניים מיוצרי העולם הצעירים ביותר אי פעם.

בול זמן:

עוד מ מטא ניוז