Scale AI entra no jogo de dados sintéticos

Nó Fonte: 1599948

O caminho da Scale AI para se tornar uma empresa de US$ 7.3 bilhões foi pavimentado com dados reais de imagens, texto, voz e vídeo. Agora, está usando essa base para entrar no jogo de dados sintéticos, uma das categorias mais quentes e emergentes da IA.

Eles anunciaram na quarta-feira um programa de acesso antecipado para Escala Sintética, um produto que os engenheiros de aprendizado de máquina podem usar para aprimorar seus conjuntos de dados existentes do mundo real, de acordo com a empresa. A Scale contratou dois executivos para construir esta nova divisão de seus negócios. Scale contratou Joel Kronander, que anteriormente liderou o aprendizado de máquina na Nines e foi um ex-engenheiro de visão computacional da Apple trabalhando em mapeamento 3D, como seu novo chefe de dados sintéticos. A empresa também contratou Vivek Raju Muppalla como diretor de serviços sintéticos. Muppalla foi anteriormente diretor de engenharia de IA e simulação na Unity Technologies.

Os dados sintéticos são o que parecem: dados falsos que foram criados por algoritmos de aprendizado de máquina em vez de usar informações do mundo real. Pode ser uma ferramenta poderosa e útil para gerar dados – como imagens médicas – quando a privacidade é uma preocupação importante. Os desenvolvedores podem usar dados sintéticos para adicionar mais complexidade aos seus modelos de treinamento e ajudar a remover preconceitos que muitas vezes podem ser encontrados em conjuntos de dados coletados do mundo real.

Dimensione inicialmente o software combinado com imagens reais, texto, dados de voz e vídeo rotulados por pessoas para fornecer às empresas de veículos autônomos os dados rotulados necessários para treinar modelos de aprendizado de máquina para desenvolver e implantar robotáxis, caminhões autônomos e bots automatizados usados ​​em armazéns e on- entrega de demanda. Desde então, a startup se transformou em uma empresa de plataforma de gerenciamento de dados com clientes que abrangem setores governamentais, financeiros, de comércio eletrônico, veículos autônomos e empresariais.

O fundador e CEO Alexandr Wang descreveu sua nova oferta como uma abordagem híbrida de dados, semelhante à carne cultivada em laboratório.

“Começamos com dados reais, assim como a carne cultivada em laboratório começa a partir de células animais reais, e depois crescemos, iteramos e construímos o produto a partir daí”, disse ele ao TechCrunch. Ao utilizar dados do mundo real como base para criar dados sintéticos, a empresa é capaz de oferecer uma oferta realmente única e poderosa aos clientes, disse Wang, acrescentando que esta foi uma lacuna que viram no mercado.

Os clientes de escala também perceberam essa lacuna. A investida da empresa em dados sintéticos foi uma resposta à demanda de seus clientes, disse Wang ao TechCrunch, que disse ter começado a desenvolver o produto há menos de um ano. O desenvolvedor de tecnologia de veículos autônomos Kodiak Robotics, Tractable AI e o Departamento de Defesa dos EUA aproveitaram a Scale para seu novo produto de dados sintéticos, disse Wang.

A Scale, que emprega hoje cerca de 450 funcionários, vê os dados sintéticos como uma prioridade máxima em 2022 e uma área na qual continuará a investir à medida que desenvolve a sua linha de produtos. Mas isso não significa que assumirá o controle do seu negócio real de dados. Wang vê os dados sintéticos como uma ferramenta complementar que ajudará os desenvolvedores a “obter mais retorno com seus algoritmos e outras IA, especialmente em casos extremos.

Por exemplo, as empresas de veículos autónomos normalmente utilizam simulação para recriar cenários do mundo real e reproduzi-los para ver como o sistema autónomo irá lidar com isso. Mas os dados do mundo real podem não fornecer o cenário que procuram.

“Você não se depara com muita frequência com cenários no mundo real onde pode haver, digamos, 100 ciclistas atravessando ao mesmo tempo”, explicou Wang. “Podemos começar com dados do mundo real e depois adicionar sinteticamente todos os ciclistas ou todas as pessoas e, assim, você pode treinar o algoritmo adequadamente.”

Fonte: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Carimbo de hora:

Mais de Techcrunch