Scale AI, 합성 데이터 게임에 뛰어들다

소스 노드 : 1599948

7.3억 달러 규모의 기업으로 성장하기 위한 Scale AI의 길은 이미지, 텍스트, 음성, 영상 등의 실제 데이터를 바탕으로 이루어졌습니다. 이제 AI에서 가장 뜨겁고 떠오르는 카테고리 중 하나인 합성 데이터 게임에 뛰어들기 위해 그 기반을 활용하고 있습니다.

그들은 수요일에 조기 액세스 프로그램을 발표했습니다. 스케일 합성, 회사에 따르면 기계 학습 엔지니어가 기존의 실제 데이터 세트를 향상하는 데 사용할 수 있는 제품입니다. Scale은 새로운 사업 부문을 구축하기 위해 두 명의 임원을 고용했습니다. Scale은 이전에 Nines에서 기계 학습을 이끌었고 전 Apple에서 3D 매핑 작업을 하는 컴퓨터 비전 엔지니어였던 Joel Kronander를 합성 데이터의 새로운 책임자로 고용했습니다. 회사는 또한 Vivek Raju Muppalla를 합성 서비스 이사로 고용했습니다. Muppalla는 이전에 Unity Technologies의 AI 및 시뮬레이션 엔지니어링 이사였습니다.

합성 데이터는 말 그대로 실제 세계의 정보를 사용하지 않고 기계 학습 알고리즘에 의해 생성된 가짜 데이터입니다. 개인 정보 보호가 가장 중요한 관심사인 경우 의료 영상과 같은 데이터를 생성하는 강력하고 편리한 도구가 될 수 있습니다. 개발자는 합성 데이터를 사용하여 교육 모델에 더 많은 복잡성을 추가하고 수집된 실제 데이터 세트에서 흔히 발견할 수 있는 편향을 제거하는 데 도움을 줄 수 있습니다.

Scale은 처음에 사람이 라벨을 붙인 실제 이미지, 텍스트, 음성 및 비디오 데이터와 소프트웨어를 결합하여 자율주행차 회사에 기계 학습 모델을 훈련하여 창고 및 현장에서 사용되는 로보택시, 자율 주행 트럭 및 자동화 봇을 개발 및 배포하는 데 필요한 라벨이 붙은 데이터를 제공했습니다. 배달을 요구합니다. 이후 이 스타트업은 정부, 금융, 전자상거래, 자율주행차 및 기업 산업 전반에 걸쳐 고객을 보유한 데이터 관리 플랫폼 회사로 변모했습니다.

창립자이자 CEO인 Alexandr Wang은 자사의 새로운 제품을 실험실에서 재배한 고기와 유사한 데이터에 대한 하이브리드 접근 방식이라고 설명했습니다.

그는 TechCrunch에 “실험실에서 배양한 고기가 실제 동물 세포에서 시작하여 거기에서 성장하고 반복하고 제품을 만드는 것과 마찬가지로 실제 데이터로 시작합니다.”라고 말했습니다. 실제 데이터를 기반으로 합성 데이터를 생성함으로써 회사는 고객에게 정말 독특하고 강력한 제품을 제공할 수 있으며 이것이 시장에서 본 격차라고 덧붙였습니다.

대규모 고객 역시 이러한 격차를 확인했습니다. 회사가 합성 데이터를 추진하는 것은 고객의 요구에 부응하기 위한 것이라고 Wang은 TechCrunch에 말했습니다. TechCrunch는 이 제품을 구축하기 시작한 지 1년이 채 되지 않았다고 말했습니다. 자율주행차 기술 개발업체인 Kodiak Robotics, Tractable AI 및 미국 국방부는 모두 새로운 합성 데이터 제품에 Scale을 활용했다고 Wang은 말했습니다.

현재 약 450명의 직원을 고용하고 있는 Scale은 합성 데이터를 2022년의 최우선 과제로 보고 제품 라인을 구축하면서 계속 투자할 영역입니다. 그러나 이것이 실제 데이터 사업을 인수한다는 의미는 아닙니다. Wang은 합성 데이터를 개발자가 “알고리즘과 기타 AI, 특히 극단적인 사례에서 더 많은 비용을 절감하는 데 도움이 되는 보완 도구로 봅니다.

예를 들어, 자율주행 자동차 회사는 일반적으로 시뮬레이션을 사용하여 현실 세계의 시나리오를 재현하고 이를 재생하여 자율 시스템이 이를 어떻게 처리하는지 확인합니다. 그러나 실제 데이터는 그들이 원하는 시나리오를 제공하지 않을 수도 있습니다.

Wang은 “자전거 100명이 동시에 건너는 현실 세계에서는 시나리오를 자주 접하지 않습니다.”라고 설명했습니다. "실제 데이터에서 시작한 다음 모든 자전거 타는 사람이나 모든 사람을 종합적으로 추가하면 알고리즘을 적절하게 훈련할 수 있습니다."

출처: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

타임 스탬프 :

더보기 테크 크런치 (TechCrunch)