Ölçekli AI, sentetik veri oyununa giriyor

Kaynak Düğüm: 1599948

Scale AI'nin 7.3 milyar dolarlık bir şirket olma yolu; görüntülerden, metinden, sesten ve videodan elde edilen gerçek verilerle döşendi. Şimdi ise yapay zekanın en popüler ve yeni ortaya çıkan kategorilerinden biri olan sentetik veri oyununa girmek için bu temeli kullanıyor.

Çarşamba günü erken erişim programını duyurdular. Ölçekli SentetikŞirkete göre, makine öğrenimi mühendislerinin mevcut gerçek dünya veri kümelerini geliştirmek için kullanabileceği bir ürün. Scale, işindeki bu yeni bölümü oluşturmak için iki yöneticiyi işe aldı. Scale, daha önce Nines'te makine öğreniminden sorumlu olan ve Apple'da 3D haritalama üzerinde çalışan eski bir bilgisayarlı görüntü mühendisi olan Joel Kronander'ı sentetik verilerin yeni başkanı olarak işe aldı. Şirket ayrıca Vivek Raju Muppalla'yı sentetik hizmetler müdürü olarak işe aldı. Muppalla daha önce Unity Technologies'de yapay zeka ve simülasyon mühendisliği direktörüydü.

Sentetik veriler, göründüğü gibidir: gerçek dünyadaki bilgileri kullanmak yerine makine öğrenimi algoritmaları tarafından oluşturulan sahte veriler. Gizliliğin en önemli konu olduğu durumlarda tıbbi görüntüleme gibi veri oluşturmak için güçlü ve kullanışlı bir araç olabilir. Geliştiriciler, eğitim modellerine daha fazla karmaşıklık eklemek ve toplanan gerçek dünya veri kümelerinde sıklıkla bulunabilen önyargıların ortadan kaldırılmasına yardımcı olmak için sentetik verileri kullanabilir.

Başlangıçta birleştirilmiş yazılımı, insanlar tarafından etiketlenen gerçek görüntüler, metin, ses ve video verileriyle ölçeklendirerek otonom araç şirketlerine, depolarda ve depolarda kullanılan robotaksileri, sürücüsüz kamyonları ve otomatikleştirilmiş botları geliştirmek ve dağıtmak üzere makine öğrenimi modellerini eğitmek için gereken etiketli verileri sağlayın. teslim talep. Başlangıç, o zamandan beri hükümet, finans, e-ticaret, otonom araç ve kurumsal endüstrileri kapsayan müşterileri olan bir veri yönetimi platformu şirketine dönüştü.

Kurucu ve CEO Alexandr Wang, yeni teklifini laboratuvarda yetiştirilen ete benzer şekilde verilere yönelik hibrit bir yaklaşım olarak tanımladı.

TechCrunch'a şöyle dedi: "Tıpkı laboratuvarda yetiştirilen etin gerçek hayvan hücrelerinden başlaması gibi, gerçek verilerle başlıyoruz ve ardından büyütüyor, yineliyor ve ürünü oradan inşa ediyoruz." Wang, sentetik veriler oluşturmak için gerçek dünya verilerini temel alarak şirketin müşterilere gerçekten benzersiz ve güçlü bir teklif sunabildiğini söyledi ve bunun piyasada bir boşluk olduğunu gördüklerini ekledi.

Ölçekli müşteriler de bu boşluğu gördü. Wang, TechCrunch'a, ürünü bir yıldan daha kısa bir süre önce oluşturmaya başladıklarını söyleyen şirketin sentetik verileri kullanmasının müşterilerinden gelen talebe yanıt olarak olduğunu söyledi. Wang, otonom araç teknolojisi geliştiricisi Kodiak Robotics, Tractable AI ve ABD Savunma Bakanlığı'nın yeni sentetik veri ürünü için Scale'den yararlandığını söyledi.

Bugün yaklaşık 450 çalışanı bulunan Scale, sentetik verileri 2022'de birinci öncelik olarak görüyor ve ürün yelpazesini geliştirirken yatırım yapmaya devam edeceği bir alan. Ancak bu, şirketin gerçek veri işini devralacağı anlamına gelmiyor. Wang, sentetik verileri, geliştiricilerin "algoritmalarından ve diğer yapay zekalardan, özellikle de uç durumlarda paralarının karşılığını daha fazla almalarına" yardımcı olacak tamamlayıcı bir araç olarak görüyor.

Örneğin, otonom araç şirketleri genellikle gerçek dünyadan senaryolar oluşturmak ve otonom sistemin bununla nasıl başa çıkacağını görmek için simülasyonu kullanıyor. Ancak gerçek dünya verileri aradıkları senaryoyu sağlamayabilir.

Wang, "Gerçek dünyada örneğin 100 bisikletlinin aynı anda karşıdan karşıya geçebileceği senaryolarla çok sık karşılaşmıyorsunuz" diye açıkladı. "Gerçek dünya verilerinden başlayabiliriz ve ardından tüm bisikletlileri veya tüm insanları sentetik olarak ekleyebiliriz ve bu şekilde algoritmayı doğru şekilde eğitebiliriz."

Kaynak: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Zaman Damgası:

Den fazla Techcrunch