Scale AI נכנס למשחק הנתונים הסינתטיים

צומת המקור: 1599948

הדרך של Scale AI להפוך לחברה של 7.3 מיליארד דולר נסללה בנתונים אמיתיים מתמונות, טקסט, קול ווידאו. כעת, היא משתמשת בבסיס הזה כדי להיכנס למשחק הנתונים הסינתטיים, אחת הקטגוריות החמות והמתפתחות ב-AI.

הם הכריזו ביום רביעי על תוכנית גישה מוקדמת קנה מידה סינתטי, מוצר שבו מהנדסי למידת מכונה יכולים להשתמש כדי לשפר את מערכי הנתונים הקיימים שלהם בעולם האמיתי, על פי החברה. Scale שכרה שני מנהלים כדי לבנות את החטיבה החדשה של העסק שלה. Scale שכרה את ג'ואל קרוננדר, שעמד בעבר בראש למידת מכונה ב-Nines והיה מהנדס ראיית מחשב לשעבר באפל שעבד על מיפוי תלת מימד, כראש החדש של נתונים סינתטיים. החברה גם שכרה את Vivek Raju Muppalla כמנהל השירותים הסינתטיים שלה. Muppalla היה בעבר מנהל הנדסה עבור AI וסימולציה בחברת Unity Technologies.

נתונים סינתטיים הם כמו שהם נשמעים: נתונים מזויפים שנוצרו על ידי אלגוריתמים של למידת מכונה ולא באמצעות מידע מהעולם האמיתי. זה יכול להיות כלי רב עוצמה ושימושי להפקת נתונים - כמו הדמיה רפואית - כאשר הפרטיות היא עניין מרכזי. מפתחים יכולים להשתמש בנתונים סינתטיים כדי להוסיף מורכבות רבה יותר למודלים האימון שלהם ולעזור להסיר הטיות שניתן למצוא לעתים קרובות במערכות נתונים שנאספו בעולם האמיתי.

קנה מידה שילבה תחילה תוכנה עם תמונות אמיתיות, נתוני טקסט, קול ווידאו שסומנו על ידי אנשים כדי לתת לחברות רכב אוטונומי את הנתונים המסומנים הדרושים כדי להכשיר מודלים של למידת מכונה לפיתוח ופריסה של רובוטקסיס, משאיות לנהיגה עצמית ובוטים אוטומטיים המשמשים במחסנים וב- לדרוש משלוח. הסטארט-אפ הפך מאז לחברת פלטפורמת ניהול נתונים עם לקוחות המשתרעים על תעשיות ממשל, פיננסים, מסחר אלקטרוני, רכב אוטונומי וארגונים.

המייסד והמנכ"ל אלכסנדר וואנג תיאר את ההצעה החדשה שלה כגישה היברידית לנתונים, הדומה לבשר שגדל במעבדה.

"אנחנו מתחילים עם נתונים אמיתיים, בדיוק כמו איך בשר שגדל במעבדה מתחיל מתאי בעלי חיים אמיתיים, ואז גדלים וחוזרים ובונים את המוצר משם", אמר ל-TechCrunch. על ידי שימוש בנתונים מהעולם האמיתי כבסיס ליצירת נתונים סינתטיים, החברה מסוגלת להציע הצעה ייחודית ועוצמתית עבור הלקוחות, אמר וואנג, והוסיף כי זה היה פער שהם ראו בשוק.

לקוחות קנה מידה ראו גם את הפער הזה. הדחיפה של החברה לנתונים סינתטיים הייתה תגובה לביקוש מלקוחותיה, אמר וואנג ל-TechCrunch, שאמר שהם התחילו לבנות את המוצר לפני פחות משנה. מפתחת טכנולוגיית הרכב האוטונומית Kodiak Robotics, Tractable AI ומשרד ההגנה האמריקני השתמשו כולם ב-Scale עבור מוצר הנתונים הסינתטיים החדש שלה, אמר וואנג.

Scale, המעסיקה כיום כ-450 עובדים, רואה בנתונים סינתטיים עדיפות עליונה בשנת 2022, ותחום שהיא תמשיך להשקיע בו תוך כדי בניית קו המוצרים שלה. אבל זה לא אומר שהיא תשתלט על עסקי הנתונים האמיתיים שלה. וואנג רואה בנתונים סינתטיים כלי משלים שיעזור למפתחים "להוציא יותר כסף מהאלגוריתמים שלהם ומ-AI אחרים, ובמיוחד עם מקרי קצה.

לדוגמה, חברות רכב אוטונומי משתמשות בדרך כלל בסימולציה כדי ליצור מחדש תרחישים מהעולם האמיתי ולהשמיע אותם כדי לראות כיצד המערכת האוטונומית תתמודד עם זה. אבל ייתכן שנתונים מהעולם האמיתי לא יספקו את התרחיש שהם מחפשים.

"אתה לא נתקל בתרחישים בעולם האמיתי לעתים קרובות מדי שבהם עלולים להיות, נניח 100 רוכבי אופניים חוצים בבת אחת," הסביר וואנג. "אנחנו יכולים להתחיל מנתונים מהעולם האמיתי ואז להוסיף באופן סינתטי את כל רוכבי האופניים או את כל האנשים ואז ככה, אתה יכול לאמן את האלגוריתם כמו שצריך."

מקור: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

בול זמן:

עוד מ Techcrunch