スケール AI が合成データ ゲームに参入

ソースノード: 1599948

Scale AI が 7.3 億ドル企業になるまでの道は、画像、テキスト、音声、ビデオからの実際のデータによって舗装されました。現在、同社はその基盤を利用して、AI の中でも注目を集めている新興カテゴリーの XNUMX つである合成データ ゲームに参入しています。

彼らは水曜日に、への早期アクセス プログラムを発表しました。 スケール合成同社によれば、この製品は機械学習エンジニアが既存の実世界のデータセットを強化するために使用できるという。 Scale は、この新しい事業部門を構築するために 3 人の幹部を雇用しました。 Scale は、以前 Nines で機械学習の責任者を務め、Apple で XNUMXD マッピングに取り組んでいたコンピューター ビジョン エンジニアだった Joel Kronander を合成データの新しい責任者として採用しました。同社はまた、合成サービスのディレクターとしてヴィヴェク・ラジュ・ムパラを雇用した。 Muppalla は以前、Unity Technologies で AI およびシミュレーションのエンジニアリング ディレクターを務めていました。

合成データとは、文字通り、現実世界からの情報を使用するのではなく、機械学習アルゴリズムによって作成された偽のデータです。プライバシーが最大の懸念事項である場合、医療画像などのデータを生成するための強力で便利なツールとなります。 開発者は合成データを使用してトレーニング モデルをさらに複雑にし、収集された現実世界のデータ セットでよく見られるバイアスを取り除くことができます。

Scale は当初、人間がラベルを付けた実際の画像、テキスト、音声、およびビデオ データとソフトウェアを組み合わせて、倉庫や倉庫で使用されるロボタクシー、自動運転トラック、自動ボットを開発および導入するための機械学習モデルをトレーニングするために必要なラベル付きデータを自動運転車会社に提供しました。配達を要求します。その後、このスタートアップは、政府、金融、電子商取引、自動運転車、エンタープライズ業界にわたる顧客を持つデータ管理プラットフォーム企業に変貌しました。

創設者兼最高経営責任者(CEO)のAlexandr Wang氏は、その新製品を研究室で育てられた肉に似た、データへのハイブリッドなアプローチだと説明した。

「実験室で飼育された肉が実際の動物細胞から始まるのと同じように、私たちは実際のデータから始めて、そこから成長し、反復して製品を構築します」と彼はTechCrunchに語った。現実世界のデータをベースとして合成データを作成することで、同社は顧客に非常にユニークで強力な製品を提供できるとワン氏は述べ、これが市場で見られたギャップであると付け加えた。

大規模顧客も同様にそのギャップを認識していました。同社が合成データを推進したのは顧客からの需要に応えたものだとWang氏はTechCrunchに語った。同製品の構築を開始したのは1年も経っていないという。ワン氏によると、自動運転車技術開発会社のコディアック・ロボティクス、トラクタブルAI、米国防総省はいずれも、新しい合成データ製品としてスケールを採用したという。

現在約 450 人の従業員を擁する Scale は、合成データを 2022 年の最優先事項と考えており、製品ラインを構築する際に今後も投資を続ける分野であると考えています。しかし、それは実際のデータ事業を引き継ぐことを意味するものではない。 Wang 氏は、合成データを、開発者が「アルゴリズムやその他の AI、特にエッジケースでより多くの利益を得るのに役立つ補完的なツール」と考えています。

たとえば、自動運転車会社は通常、シミュレーションを使用して現実世界のシナリオを再現し、それを再生して自動運転システムがどのように処理するかを確認します。しかし、現実世界のデータは、彼らが探しているシナリオを提供しない可能性があります。

「現実の世界では、たとえば 100 人の自転車が同時に横断するようなシナリオに遭遇することはあまりありません」と Wang 氏は説明します。 「実世界のデータから始めて、すべての自転車選手またはすべての人々を合成的に追加することで、アルゴリズムを適切にトレーニングできます。」

出典: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

タイムスタンプ:

より多くの TechCrunchの