Hur man väljer och distribuerar branschspecifika AI-modeller

Återutgiven av Platon

anhängare: 0

DJ Das Bidragsgivare

DJ Das är grundaren och VD för ThirdEye-data, ett företag som förvandlar företag med AI-applikationer. En seriell och parallell entreprenör, DJ är också en ängelinvesterare i olika datacentrerade startups i Silicon Valley.

Som artificiell intelligens blir mer avancerade, tidigare banbrytande – men generiska – AI-modeller blir vanliga, som Google Clouds Vision AI or Amazon-erkännande.

Även om de är effektiva i vissa användningsfall, passar dessa lösningar inte branschspecifika behov direkt. Organisationer som söker de mest exakta resultaten från sina AI-projekt måste helt enkelt vända sig till branschspecifika modeller.

Varje team som vill utöka sin AI-kapacitet bör först tillämpa sina data och användningsfall på en generisk modell och bedöma resultaten.

Det finns några sätt som företag kan generera branschspecifika resultat. En skulle vara att anta ett hybridt tillvägagångssätt – ta en generisk AI-modell med öppen källkod och träna den vidare för att anpassa sig till företagets specifika behov. Företag kan också vända sig till tredjepartsleverantörer, som IBM eller C3, och få tillgång till en komplett lösning direkt från hyllan. Eller – om de verkligen behövde – kunde datavetenskapsteam bygga sina egna modeller internt, från grunden.

Låt oss dyka in i var och en av dessa tillvägagångssätt och hur företag kan bestämma vilken som fungerar för deras olika omständigheter.

Generiska modeller ensamma klipper det ofta inte

Generiska AI-modeller som Vision AI eller Rekognition och öppen källkodsmodeller från TensorFlow eller Scikit-learn ger ofta inte tillräckliga resultat när det kommer till nischade användningsfall inom branscher som finans eller energisektorn. Många företag har unika behov, och modeller som inte har kontextuella data från en viss bransch kommer inte att kunna ge relevanta resultat.

Bygger på toppen av modeller med öppen källkod

På ThirdEye Data arbetade vi nyligen med ett energibolag för att märka och upptäcka defekter i elstolpar genom att använda AI för att analysera tusentals bilder. Vi började använda Google Vision API och upptäckte att det inte kunde ge våra önskade resultat – med precisionen och återkallningsvärdena för AI-modellerna helt oanvändbara. Modellerna kunde inte läsa tecknen i taggarna på elstolparna 90 % av tiden eftersom de inte identifierade det icke-standardiserade teckensnittet och de olika bakgrundsfärgerna som användes i taggarna.

Så vi tog basmodeller för datorseende från TensorFlow och optimerade dem för elföretagets exakta behov. Efter två månaders utveckling av AI-modeller för att upptäcka och dechiffrera taggar på elstolparna, och ytterligare två månaders träning av dessa modeller, visar resultaten en noggrannhetsnivå på över 90 %. Dessa kommer att fortsätta att förbättras med tiden med omskolningsupprepningar.

Varje team som vill utöka sin AI-kapacitet bör först tillämpa sina data och användningsfall på en generisk modell och bedöma resultaten. Algoritmer med öppen källkod som företag kan börja med kan hittas på AI- och ML-ramverk som TensorFlow, Scikit-learn eller Microsoft Cognitive Toolkit. På ThirdEye Data använde vi Convolutional Neural Network (CNN) algoritmer på TensorFlow.

Sedan, om resultaten är otillräckliga, kan teamet utöka algoritmen genom att träna den vidare på sin egen branschspecifika data.

Källa: https://techcrunch.com/2021/04/12/how-to-choose-and-deploy-industry-specific-ai-models/

Tidsstämpel: 12 april 2021