יצירתיות מונעת בינה מלאכותית מעניקה למחשבים מוגזמים משהו שכדאי לעשות, סוף סוף

צומת המקור: 1729591

טור עד לאחרונה, נראה היה שחומרת המחשב האישי עברה כל דרישה שתוכנה יכולה להציב עליה. אפילו משחקים מתקדמים - באופן מסורתי הקצה המוביל של דרישות המשתמשים לגבי ביצועים - בקושי הטילו מס על הסיליקון הגבוה ביותר הזמין. ואז הגיעה אמנות הבינה המלאכותית.

המיקרו-מעבד M1 Ultra של אפל כולל ספירת טרנזיסטורים מצפון ל-100 מיליארד. Nvidia הוציאה את זה עכשיו ספינת הדגל RTX 4090 GPU, עם 76 מיליארד טרנזיסטורים - גידול של פי 500 לעומת הדור הקודם, תוצר של צומת התהליך האחרון, ויחס של השטן לצריכת חשמל. כמעט XNUMXW TDP? הפעל אותו וחמם את הבית שלך בחורף הזה.

אבל לאיזו מטרה? קרב רויאל של Fortnite 300fps? באפריל כתבתי: "צריך לאלף, לאמן את המפלצות האלה ולהפעיל אותן." הטכנולוגיה מתעבת ואקום - ארבעה עשורים בתחום לימדו אותי את זה. איפה שיש יכולת, משהו יבוא כדי להעסיק אותה.

הנעל הנוספת הזו נפלה בתחילת ספטמבר, אז HuggingFace AI - חברה פרטית שיוצרת כלי תוכנה המנצלים טכניקות בינה מלאכותית מתקדמות - שוחררה דיפוזיה יציבה.

בדומה למערכות כגון DALL•E ו אמצע מסע, Stable Diffusion מתרחף ואז מצמצם מיליארדי תמונות לאסימונים משוקלל סמלי שניתן להעלות בחזרה לנראות עם הנחית טקסט בעלת מבנה מתאים. כל העניין נמצא רק בצד הזה של הכישוף - ובכל זאת זה עובד בצורה יוצאת דופן.

שלא כמו DALL•E או Midjourney, דיפוזיה יציבה היא גם עצמאית לחלוטין - מסוגלת לפעול על כל מכונה חזקה מספיק - וגם FOSS טהורה. המשמעות היא שלמרות שהמהדורה הראשונית דרשה כמה ממעבדי ה-GPU המתקדמים ביותר של Nvidia, בתוך שבוע התורמים לפרויקט הסיר את הקוד שלו והפחית את דרישות החומרה שלו. הגרסה הנוכחית יכולה לרוץ בצורה נוחה למדי על המחשב הבשרני שקניתי לפני שש שנים כדי לחקור את העולם החדש של מציאות מדומה - כמו גם על כמעט כל מק מבוסס M1. מחשבי גיימינג ומחשבים ניידים רבים יכולים להפעיל את Stable Diffusion מספיק טוב כדי להשתמש בו לצרכים יצירתיים מבוססי פרויקט - או סתם בשביל הכיף.

אחר כך קבוצת חוקרים פרסם מאמר על משהו שהם כינו Dreamfusion - מסוגל להעלות באוב סדרה אינסופית של מודלים תלת מימדיים ממומשים במלואם מהנחיות טקסט. הקלד pineapple, והמחשב יחשוב, ואז ייצור את הקירוב הטוב ביותר שלו לגבי איך הדגם הזה אמור להיראות. למרות שקבוצה זו עדיין לא פרסמה את הקוד שלה, העיתון סיפק מספיק תוכנית לקודדן שאפתני שיתאים את בסיס הקוד של דיפוזיה יציבה ליצירת Dreamfusion יציב - מה ששוב, דורש חומרה חזקה למדי.

תמונה שהופקה על ידי Stable Diffusion מהנחיית הטקסט 'רובוט מצייר תמונה תוך כדי ריצה על הליכון' … לחץ להגדלה

שלא להתעלם מכך, קבוצה אחרת באוניברסיטת תל אביב הדהימה את העולם עם ה מודל פיזור תנועה אנושי. מאמר זה הראה כיצד חוקרים השתמשו בטכניקות AI מבוססות דיפוזיה כדי להמיר הנחיה כגון "the person walks forward two steps and does a cartwheel" לכדי אנימציה הומניפורמית. שבוע לאחר מכן, החוקרים עצמם שחררו את הקוד שלהם בתור FOSS.

אנחנו עדיין קצת מוקדמים בצמיחה האקספוננציאלית הזו ביכולות הבינה המלאכותית כדי לדעת לאן כל זה יוביל. כבר עכשיו, גם Canva וגם Microsoft שילבו מחוללי תמונות מבוססי הנחיות בכלים היצירתיים שלהם. מטה, Google, ואחרים הדגימו מחוללים קנייניים של הנחיות לווידאו. במגמה הנוכחית, לא נצטרך לחכות זמן רב עד שיהיו לנו מקבילות FOSS לשחק איתן.

לאמנויות החזותיות יש כלים חדשים רבי עוצמה שאינם נחלתם הבלעדית של ענקיות כמו גוגל או OpenAI - החברה האחרונה שהבטיחה לעשות דמוקרטיזציה של בינה מלאכותית בבסיסה, אבל נראה בצורה מעוותת שהתמקדה ביצירת אימפריה קניינית משלה עם מיקרוסופט בתור שלה. בעלים לא רשמי.

באחד הטורים הראשונים שלי עבור הקופה הצבעתי על הסוף של מחזור השדרוג האינסופי עבור מחשבים אישיים. לא עוד הליכון: מספיק טוב, הם יוחלפו רק כשהם נשחקו. למעט שלל שדרוגים להכיל ועידת וידאו מונעת מגיפה התחזית הזו הוכחה כנכונה.

אבל המחשב האישי השיל את עורו, וחשף את צורתו החדשה והחלקלקת כמחשב-על יצירתי: בעל כוח דיפוזיה ובעל יכולת יצירתית בדרכים שה-PC של פעם לא יכול היה להתחיל להתקרב. במקום להציע עוד חרט או מכחול חדש, הכלים השונים האיכותיים הללו יוצרים סוג חדש של שותפות יצירתית.

ביוני ביצעתי רכישה של מחשב נייד עם מפרט גבוה - ומיד הרגשתי אשמה על כך, וחשבתי שלעולם לא באמת הפעלתי אותו. היום, אני עושה שימוש מלא במכונה שיכולה לעשות גם את המקסימום וגם את המדהים. בדיעבד, הרכישה הזו נראית כמו מציאה חכמה - מבשר על רנסנס אמיתי - כשה-PC, שנולד מחדש, מתחיל לעבוד. ®

בול זמן:

עוד מ הקופה