A Snorkel AI 35 millió dollárt ér el a B sorozatban az adatcímkézés automatizálásáért a gépi tanulásban

Forrás csomópont: 803713

A gépi tanulás egyik fárasztóbb aspektusa egy olyan címkekészlet biztosítása, amely megtanítja a gépi tanulási modellnek, hogy mit kell tudnia. Snorkel AI szeretné megkönnyíteni a téma szakértői számára ezeknek a címkéknek a programozott alkalmazását, és ma a startup bejelentette a 35 millió dolláros B sorozatot.

Bejelentette az Application Studio nevű új eszközt is, amely sablonok és előre definiált komponensek felhasználásával általános gépi tanulási alkalmazások készítését biztosítja.

A Lightspeed Venture Partners vezette a fordulót korábbi befektetők, Greylock, GV, In-Q-Tel és Nepenthe Capital részvételével. Új befektetők, Walden és BlackRock is csatlakoztak. A startup jelentése szerint most 50 millió dollárt gyűjtött be.

A cég társalapítója és vezérigazgatója, Alex Ratner szerint az adatcímkézés továbbra is óriási kihívást jelent és akadályt jelent a gépi tanulás és a mesterséges intelligencia előremozdításában számos iparágon belül, mivel költséges, munkaigényes és a téma szakértői számára nehéz időt szakítani. csinálni.

„A mesterséges intelligencia manapság nem annyira rejtett titka, hogy az összes technológiai és eszközfejlesztés ellenére egy átlagos mesterségesintelligencia-projekt költségének és idejének 80-90%-a csupán a képzési adatok manuális címkézésére, összegyűjtésére és átcímkézésére megy el.” ő mondta.

Elmondja, hogy cége kifejlesztett egy megoldást ennek a folyamatnak a leegyszerűsítésére, hogy megkönnyítse a téma szakértői számára a címkék programozott hozzáadását. Ez a folyamat szerinte meglehetősen drámai módon hónapokról órákra vagy napokra csökkenti a címkék felviteléhez szükséges időt és erőfeszítést. , az adatok összetettségétől függően.

Miközben a vállalat kidolgozta ezt a módszertant, az ügyfelek segítséget kértek a gépi tanulási folyamat következő lépésében, amely a képzési adatok és a modell felvétele, valamint egy alkalmazás létrehozása. Itt jön be az Application Studio. Lehet, hogy egy banki szerződés-osztályozó, vagy egy távközlési vállalatnál hálózati anomália-érzékelő, és segít a vállalatoknak megtenni ezt a következő lépést az adatcímkézés után.

"Ez nem csak az adatok programozási címkézéséről szól, hanem a modellekről, az előfeldolgozókról és az utófeldolgozókról is, ezért ezt most egyfajta sablonos és vizuális kód nélküli felületen tettük elérhetővé" - mondta.

A cég termékei a Stanford AI Lab-ban 2015-ben megkezdett kutatásokon alapulnak. Az alapítók négy évet töltöttek a kutatási fázisban, mielőtt 2019-ben piacra dobták a Snorkelt. A startup jelenleg 40 alkalmazottat foglalkoztat. Ratner felismeri a technológiai ipar problémáit a sokszínűség szempontjából, és azt mondja, hogy tudatos erőfeszítéseket tett egy sokszínű és befogadó vállalat felépítésére.

„Amit elmondhatok, az az, hogy az első naptól kezdve igyekeztünk vállalati szinten, teljes csapatszinten és igazgatósági szinten prioritást adni, és e mögé tenni is. Így külső cégekkel dolgoztunk együtt a belső képzések, auditok és a DEI-vel kapcsolatos stratégiák kidolgozásában, és a csővezetékek sokféleségét, mint a toborzócégekkel kötött szerződéseink megtárgyalhatatlan követelményét tettük” – mondta.

Ratner azt is felismeri, hogy az automatizálás keményen kódolhatja a gépi tanulási modellek torzítását, és reméli, hogy a címkézési folyamat egyszerűsítésével sokkal könnyebbé válik a torzítás észlelése, amikor ez megtörténik.

„Ha egy tucat-két tucat olyan funkcióval kezdi, amit a Snorkelben címkézési funkciónak nevezünk, akkor is ébernek és proaktívnak kell lennie az elfogultság észlelésében, de könnyebb ellenőrizni, hogy mi tanította meg a modellt a változtatásra, egyszerűen csak vissza kell térni és néhány száz sornyi kódot nézegetve.”

Forrás: https://techcrunch.com/2021/04/07/snorkel-ai-scores-35m-series-b-to-automate-data-labeling-in-machine-learning-apps/

Időbélyeg:

Még több TechCrunch