Tilmeld dig Transform 2021 den 12.-16. juli. Tilmeld dig fr årets AI-begivenhed.
MLOps, en sammensætning af "maskinlæring" og "informationsteknologioperationer", er en nyere disciplin, der involverer samarbejde mellem datavidenskabsfolk og it-professionelle med det formål at produktisere maskinlæringsalgoritmer. Markedet for sådanne løsninger kan vokse fra 350 millioner dollars til 4 milliarder dollars i 2025. ifølge til Cognilytica. Men visse nuancer kan gøre implementering af MLOps til en udfordring. EN undersøgelse af NewVantage Partners fandt ud af, at kun 15 % af førende virksomheder har implementeret AI-kapaciteter i produktion i enhver skala.
Alligevel kan forretningsværdien af MLOps ikke ignoreres. En robust datastrategi gør det muligt for virksomheder at reagere på skiftende omstændigheder, til dels ved ofte at bygge og teste maskinlæringsteknologier og frigive dem til produktion. MLOps sigter hovedsageligt på at indfange og udvide tidligere operationelle praksisser, samtidig med at disse praksisser udvides til at håndtere de unikke udfordringer ved maskinlæring.
Hvad er MLOps?
MLOps, som blev født i skæringspunktet mellem DevOps, datateknik og maskinlæring, ligner DevOps, men adskiller sig i udførelse. MLOps kombinerer forskellige færdighedssæt: dataforskere med speciale i algoritmer, matematik, simuleringer og udviklerværktøjer og dem hos driftsadministratorer, der fokuserer på opgaver som opgraderinger, produktionsimplementeringer, ressource- og datastyring og sikkerhed.
Et mål med MLOps er at udrulle nye modeller og algoritmer problemfrit uden at pådrage sig nedetid. Fordi produktionsdata kan ændre sig på grund af uventede hændelser, og maskinlæringsmodeller reagerer godt på tidligere sete scenarier, kan hyppig genoptræning - eller endda kontinuerlig online træning - gøre forskellen mellem en optimal og suboptimal forudsigelse.
En typisk MLOps-softwarestak kan spænde over datakilder og de datasæt, der er oprettet ud fra dem, såvel som et lager af AI-modeller tagget med deres historier og attributter. Organisationer med MLOps-operationer kan også have automatiserede pipelines, der administrerer datasæt, modeller, eksperimenter og softwarebeholdere - typisk baseret på Kubernetes - for at gøre det nemmere at køre disse job.
At Nvidia, skal udviklere, der kører jobs på intern infrastruktur, udføre kontroller for at sikre, at de overholder MLOps bedste praksis. For det første skal alt køre i en container for at konsolidere de biblioteker og kørselstider, der er nødvendige for AI-apps. Jobs skal også lancere containere med en godkendt mekanisme og køre på tværs af flere servere, samt vise ydeevnedata for at afsløre potentielle flaskehalse.
Et andet firma, der omfavner MLOps, softwareopstart GreenStream, inkorporerer kodeafhængighedsstyring og test af maskinlæringsmodeller i sine udviklingsarbejdsgange. GreenStream automatiserer modeltræning og -evaluering og udnytter en ensartet metode til at implementere og betjene hver model, samtidig med at mennesker holdes i løkken.
Implementering af MLO'er
I betragtning af alle de elementer, der er involveret i MLOps, er det ikke overraskende, at virksomheder, der anvender det, ofte løber ind i vejspærringer. Dataforskere skal justere forskellige funktioner - såsom hyperparametre, parametre og modeller - mens de administrerer kodebasen for at opnå reproducerbare resultater. De skal også deltage i modelvalidering ud over konventionelle kodetests, herunder enhedstest og integrationstest. Og de skal bruge en flertrins pipeline til at omskole og implementere en model - især hvis der er risiko for nedsat ydeevne.
Når man formulerer en MLOps-strategi, hjælper det at begynde med at formulere maskinlæringsmål ud fra forretningsvækstmål. Disse mål, som typisk kommer i form af KPI'er, kan have bestemte præstationsmål, budgetter, tekniske krav og så videre. Derfra kan organisationer arbejde hen imod at identificere inputdata og den slags modeller, der skal bruges til disse data. Dette efterfølges af dataforberedelse og -behandling, som omfatter opgaver som at rense data og udvælge relevante funktioner (dvs. de variabler, der bruges af modellen til at lave forudsigelser).
Vigtigheden af datavalg og forberedelse kan ikke overvurderes. I en nylige Atlation-undersøgelse, et klart flertal af medarbejdere angav datakvalitetsproblemer som årsagen til, at deres organisationer ikke lykkedes med at implementere AI og maskinlæring. XNUMX procent af fagfolkene sagde, at iboende skævheder i de data, der bruges i deres AI-systemer, producerer diskriminerende resultater, der skaber overholdelsesrisici for deres organisationer.
På dette stadium udvides MLOps til modeltræning og -eksperimentering. Funktioner som versionskontrol kan hjælpe med at holde styr på data og modelkvaliteter, efterhånden som de ændrer sig gennem testning, samt hjælpe med at skalere modeller på tværs af distribuerede arkitekturer. Når først maskinlæringspipelines er bygget og automatiseret, kan implementeringen i produktionen fortsætte, efterfulgt af overvågning, optimering og vedligeholdelse af modeller.
En kritisk del af overvågningsmodeller er styring, hvilket her betyder at tilføje kontrolforanstaltninger for at sikre, at modellerne lever op til deres ansvar. EN studere af Capgemini fandt ud af, at kunder og medarbejdere vil belønne organisationer, der praktiserer etisk kunstig intelligens, med større loyalitet, mere forretning og endda en vilje til at tale for dem – og vil straffe dem, der ikke gør det. Undersøgelsen tyder på, at virksomheder, der ikke nærmer sig problemet med omtanke, kan pådrage sig både omdømmerisiko og et direkte hit på deres bundlinje.
Fordelene ved MLOps
Sammenfattende gælder MLOps for hele maskinlæringslivscyklussen, inklusive dataindsamling, modeloprettelse, orkestrering, implementering, sundhed, diagnostik, styring og forretningsmålinger. Hvis de udføres med succes, kan MLO'er bringe forretningsinteresse i forgrunden for AI-projekter, samtidig med at dataforskere kan arbejde med klar retning og målbare benchmarks.
Virksomheder, der ignorerer MLO'er, gør det på egen risiko. Der er mangel på dataforskere, der er dygtige til at udvikle apps, og det er svært at følge med udviklingen af forretningsmålene – en udfordring, der forværres af kommunikationshuller. Ifølge en IDC-undersøgelse fra 2019 er mangel på færdigheder og urealistiske forventninger fra C-pakken de vigtigste årsager til fiasko i maskinlæringsprojekter. I 2018, Element AI anslået at af de 22,000 Ph.D.-uddannede forskere, der arbejder globalt med AI-udvikling og forskning, er kun 25 % "velbevandret nok i teknologien til at arbejde med teams for at tage det fra forskning til anvendelse."
Der er også det faktum, at modeller ofte glider væk fra det, de var beregnet til at opnå. Vurdering af risikoen for disse fejl som en del af MLOps er et vigtigt skridt, ikke kun for regulatoriske formål, men for at beskytte mod forretningsmæssige konsekvenser. For eksempel ville omkostningerne ved en unøjagtig videoanbefaling på YouTube være meget lavere sammenlignet med at markere en uskyldig person for bedrageri og blokere deres konto eller afvise deres låneansøgninger.
Fordelen ved MLOps er, at det sætter driftsteams på forkant med bedste praksis i en organisation. Flaskehalsen, der er resultatet af maskinlæringsalgoritmer, letter med en smartere opdeling af ekspertise og samarbejde fra operations- og datateams, og MLOps strammer denne sløjfe.
VentureBeat
VentureBeats mission er at være et digitalt bytorv for tekniske beslutningstagere for at få viden om transformativ teknologi og handle. Vores websted leverer væsentlig information om datateknologier og strategier til at guide dig, mens du leder dine organisationer. Vi inviterer dig til at blive medlem af vores fællesskab for at få adgang til:
- ajourførte oplysninger om emner, der interesserer dig
- vores nyhedsbreve
- gated tankelederindhold og nedsat adgang til vores dyrebare begivenheder, såsom Forvandling 2021: Lær mere
- netværksfunktioner og mere
Kilde: https://venturebeat.com/2021/05/07/harnessing-the-power-of-machine-learning-with-mlops/
- 000
- 2019
- 2021
- adgang
- Konto
- Fordel
- fortaler
- AI
- algoritmer
- Alle
- tillade
- Anvendelse
- applikationer
- apps
- Automatiseret
- BEDSTE
- bedste praksis
- Billion
- Bygning
- virksomhed
- Capgemini
- udfordre
- lave om
- Kontrol
- Rengøring
- kode
- samarbejde
- Kommunikation
- samfund
- Virksomheder
- selskab
- Compliance
- Forbindelse
- Container
- Beholdere
- indhold
- Kunder
- data
- datastyring
- datakvalitet
- datastrategi
- Udvikler
- udviklere
- Udvikling
- DevOps
- digital
- nedetid
- medarbejdere
- Engineering
- begivenhed
- Eventbrite
- begivenheder
- udførelse
- Udvid
- Manglende
- Funktionalitet
- Fornavn
- Fokus
- Forbes
- formular
- bedrageri
- regeringsførelse
- Grow
- Vækst
- vejlede
- Helse
- link.
- HTTPS
- Mennesker
- IDC
- Herunder
- oplysninger
- Infrastruktur
- integration
- interesse
- involverede
- spørgsmål
- IT
- It-fagfolk
- Karriere
- juli
- holde
- Nøgle
- viden
- Kubernetes
- lancere
- føre
- førende
- LÆR
- læring
- Line (linje)
- lån
- Loyalitet
- machine learning
- Flertal
- ledelse
- Marked
- matematik
- Metrics
- million
- Mission
- MLOps
- model
- overvågning
- Nvidia
- online
- Produktion
- ydeevne
- magt
- forudsigelse
- Forudsigelser
- produktion
- professionelle partnere
- projekter
- beskytte
- kvalitet
- årsager
- Krav
- forskning
- ressource
- Resultater
- omskoling
- Risiko
- Roll
- Kør
- kører
- Scale
- forskere
- sikkerhed
- servering
- mangel
- færdigheder
- So
- Software
- Løsninger
- firkant
- Stage
- opstart
- Strategi
- Studere
- Kortlægge
- Systemer
- Teknisk
- Teknologier
- Teknologier
- Test
- tests
- top
- spor
- Kurser
- værdi
- VentureBeat
- version kontrol
- video
- WHO
- inden for
- Arbejde
- youtube