Масштабный ИИ вступает в игру с синтетическими данными

Исходный узел: 1599948

Путь Scale AI к тому, чтобы стать компанией стоимостью 7.3 миллиарда долларов, был проложен реальными данными из изображений, текста, голоса и видео. Теперь он использует эту основу, чтобы войти в игру с синтетическими данными, одну из самых популярных и новых категорий в ИИ.

В среду они объявили о программе раннего доступа к Шкала синтетическая, продукт, который инженеры по машинному обучению могут использовать для улучшения своих существующих наборов данных реального мира, по словам компании. Scale наняла двух руководителей для создания нового подразделения своего бизнеса. Scale наняла Джоэла Кронандера, который ранее возглавлял машинное обучение в Nines и был бывшим инженером по компьютерному зрению в Apple, работавшим над 3D-картографированием, в качестве нового руководителя отдела синтетических данных. Компания также наняла Вивека Раджу Муппаллу в качестве директора по синтетическим услугам. Муппалла ранее был директором по разработке искусственного интеллекта и моделирования в Unity Technologies.

Синтетические данные — это поддельные данные, которые были созданы алгоритмами машинного обучения, а не с использованием информации из реального мира. Это может быть мощный и удобный инструмент для создания данных, таких как медицинские изображения, когда конфиденциальность является главной задачей. Разработчики могут использовать синтетические данные, чтобы усложнить свои модели обучения и помочь устранить систематические ошибки, которые часто можно найти в собранных наборах реальных данных.

Первоначально Scale объединяла программное обеспечение с реальными изображениями, текстом, голосом и видеоданными, помеченными людьми, чтобы предоставить автономным транспортным компаниям помеченные данные, необходимые для обучения моделей машинного обучения для разработки и развертывания роботакси, беспилотных грузовиков и автоматизированных ботов, используемых на складах и в других местах. требовать доставки. С тех пор стартап превратился в компанию, занимающуюся платформой управления данными, клиентами которой являются правительство, финансы, электронная коммерция, автономные транспортные средства и предприятия.

Основатель и генеральный директор Александр Ванг описал свое новое предложение как гибридный подход к данным, похожий на выращенное в лаборатории мясо.

«Мы начинаем с реальных данных, точно так же, как выращенное в лаборатории мясо начинается с настоящих клеток животных, а затем выращивается, повторяется и строится на основе этого продукта», — сказал он TechCrunch. Используя реальные данные в качестве основы для создания синтетических данных, компания может предложить действительно уникальное и мощное предложение для клиентов, сказал Ван, добавив, что они увидели пробел на рынке.

Клиенты Scale также увидели этот пробел. Компания начала использовать синтетические данные в ответ на спрос со стороны своих клиентов, сказал Ван TechCrunch, который сказал, что они начали создавать продукт менее года назад. По словам Вана, разработчик технологий автономных транспортных средств Kodiak Robotics, Tractable AI и Министерство обороны США использовали Scale для своего нового продукта синтетических данных.

Компания Scale, в которой сегодня работает около 450 сотрудников, считает синтетические данные своим главным приоритетом в 2022 году и областью, в которую она будет продолжать инвестировать по мере создания своей линейки продуктов. Но это не означает, что он возьмет на себя реальный бизнес данных. Ван рассматривает синтетические данные как дополнительный инструмент, который поможет разработчикам «получить больше отдачи от своих алгоритмов и другого ИИ, особенно в крайних случаях».

Например, автономные транспортные компании обычно используют моделирование, чтобы воссоздать сценарии из реального мира и воспроизвести их, чтобы увидеть, как автономная система справится с этим. Но реальные данные могут не соответствовать тому сценарию, который они ищут.

«Вы не слишком часто сталкиваетесь со сценариями в реальном мире, когда, скажем, 100 велосипедистов пересекают дорогу одновременно», — объяснил Ван. «Мы можем начать с реальных данных, а затем синтетически добавить всех велосипедистов или всех людей, и тогда вы сможете правильно обучить алгоритм».

Источник: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Отметка времени:

Больше от Techcrunch