Kontekst, konsistens og samarbeid er avgjørende for suksess i datavitenskap

Kilde node: 1882940

Kontekst, konsistens og samarbeid er avgjørende for suksess i datavitenskap
Photo by mohamed_hassan på Pixabay

 

Feltene kunstig intelligens (AI) og maskinlæring (ML) er, ved slutten av 2021, ikke lenger begynnende felt med usikker fremtid foran seg. AI og ML har vokst til å bli massivt innflytelsesrike innflytelsessfærer på den bredere verden av datavitenskap, et faktum har holdt seg sannere enn noensinne gjennom dette året.

Ettersom AI, ML og, senere, datavitenskap har fortsatt å utvide seg, har det også parametrene som kan gjøre eller ødelegge suksessen til datavitenskapsteam. Mulighetene for å få betydelig og dyp innsikt fra feltene AI og ML er basert på datavitenskapsteam som er større enn bare én dataforsker som opererer med en enkelt bærbar PC. Det er rett og slett for mye data som må innhentes, renses og klargjøres for analyse – en prosess som bruker en betydelig del av en dataforskers gjennomsnittlige arbeidsdag – for en person å håndtere alene. 

Moderne datavitenskapsprosjekter dreier seg om viktig informasjon om dataforberedelse, tidligere datavitenskapelige prosjekter og potensielle måter å distribuere datamodeller på som må deles med flere datavitenskaper. Derfor er det avgjørende å undersøke årsakene til at datavitenskapsteam krever kontekst, konsistens og sikkert samarbeid mellom dataene sine for å sikre datavitenskapelig suksess. La oss raskt undersøke hvert av disse kravene, slik at vi bedre kan forstå hvordan datavitenskapelig suksess fremover kan se ut.

Del én: Kontekst

 
Vår undersøkelse av fremtidig datavitenskapelig suksess begynner med kontekst: ingen prosess med iterativ modellbygging som er avhengig av prøv-det-og-feil-eksperimentering kan vare lenge uten institusjonell kunnskap som er dokumentert, lagret og gjort tilgjengelig for dataforskere. Og likevel går mye institusjonell kunnskap jevnlig tapt på grunn av mangel på riktig dokumentasjon og lagring.

Tenk på dette vanlige scenariet: en junior- eller borgerdataforsker blir dratt inn i et prosjekt for å forbedre ferdighetene sine, bare for å slite like etter med synkront og asynkront samarbeid på grunn av mangel på kontekst. Disse ad-hoc-teammedlemmene trenger kontekst for å vite mer om dataene de samhandler med, personene som har tatt opp problemer tidligere, og hvordan tidligere arbeid påvirket det nåværende prosjektlandskapet.

Behovet for å dokumentere prosjekter så vel som datamodeller og deres arbeidsflyt kan lett distrahere et team av dataforskere, enn si en enkelt som opererer alene. Ledere kan vurdere muligheten til å ansett en frilansutvikler å bidra med tiden sin til bevaring og formidling av institusjonell kunnskap for å forbedre standard gjennomgang og tilbakemeldingsøkter for moderne datavitenskapelige prosjekter. Disse øktene så vel som programvaresystemer, arbeidsbenker og beste praksis kan strømlinjeforme den mer effektive fangsten av prosjektrelatert kontekst som forbedrer dataoppdagbarheten til yngre og borgerlige dataforskere i fremtiden.

Datavitenskapelig suksess krever strømlinjeformet kunnskapshåndtering og dens omgivende kontekst. Uten det vil nye, yngre og innbyggere dataforskere sannsynligvis slite med onboarding og det meningsfulle bidraget til prosjektene deres, noe som igjen fører til at team gjenskaper prosjekter i stedet for å bidra til tidligere arbeid. 

Del to: Konsistens

 
Feltene ML og AI har bidratt til grunnleggende endringer når det gjelder finansielle tjenester, helse- og biovitenskap og produksjon; disse bransjene er imidlertid underlagt betydelige regulatoriske miljøer. Dette betyr at et AI-prosjekt som foregår i et regulert miljø skal være reproduserbart med et tydelig revisjonsspor. Med andre ord, IT- og bedriftsledere som på en eller annen måte er involvert i et datavitenskapelig prosjekt må sikre et nivå av datakonsistens når det gjelder resultatene til datavitenskapsprosjektet deres. 

IT- og bedriftsledere som kan forvente et pålitelig nivå av konsistens, kan også glede seg over mer selvtillit når det er på tide å foreta den typen strategiske endringer som AI legger til rette for. Det er mye som står på spill når det kommer til datavitenskapelige prosjekter, og det er mange investeringer som står på dem, så dataforskere fortjener en infrastruktur der de kan operere med et garantert reproduserbarhetsnivå fra start til slutt. Denne fulle reproduserbarheten oversetter til konsistensen i data som toppledere ser etter for å avgjøre om et datavitenskapelig prosjekt er tilstrekkelig betydelig og i samsvar med deres forretningsmål.

Disse topplederne bør på sin side forvente at når vitenskapsteamene deres utvider seg, vil de nødvendige opplæringssettene og maskinvarekravene også for å sikre konsistens i resultater fra eldre prosjekter. Derfor er prosesser og systemer som hjelper til med å administrere et miljø en absolutt nødvendighet for utvidelse av datavitenskapsteam. Hvis for eksempel en dataforsker bruker en bærbar datamaskin mens en dataingeniør kjører en annen versjon av et bibliotek som kjører på en sky-VM, kan denne dataforskeren se datamodellen deres produsere forskjellige resultater fra én maskin til den neste. Hovedpoenget: ledere bør sørge for at deres datasamarbeidspartnere har en konsekvent måte å dele de nøyaktig samme programvaremiljøene på.

Del tre: Samarbeid

 
Til slutt kommer vi til viktigheten av trygt samarbeid. Etter hvert som bedrifter fortsetter å endre sin virksomhet til en arbeid hjemmefra-modell, innser organisasjoner at datavitenskapelig samarbeid er mye vanskeligere enn personlig samarbeid. Selv om noen kjerneoppgaver innen datavitenskap er håndterbare ved hjelp av én enkelt datavitenskap (dataforberedelse, forskning og datamodelliterering), har flertallet av bedriftsledere ved en feiltakelse forlatt samarbeidet ved siden av og har senere hindret ekstern produktivitet.

Men hvordan legger man til rette for effektiv og ekstern koordinering mellom prosjektdeltakere samt sikkerheten til prosjektdata? Svaret ligger i delbare arbeidsfiler og data knyttet til et datavitenskapsprosjekt som gjør det mer levedyktig å spre informasjon eksternt. Og ettersom formidling av prosjektrelaterte data blir enklere, jo enklere det blir å dele informasjon, jo lettere er det å legge til rette for eksternt datasamarbeid. Deltakere i et datavitenskapelig prosjekt kan utnytte skybaserte verktøy for å styrke sikkerheten bak forskningen deres. men for mange ledere har gjort den feilen å ikke oppmuntre til samarbeid, noe som reduserer produktiviteten.

konklusjonen

 
Den store fremgangen som har utspilt seg innen datavitenskap de siste årene har vært enestående og ærlig talt fantastisk. Datavitenskapens fremgang har gjort det mulig for selskaper over hele verden å ta opp spørsmål som tidligere hadde få, om noen, lett tilgjengelige svar uten innovasjonene som har blitt muliggjort av AI og ML. 

Men ettersom verden av datavitenskap fortsetter å modnes og vokse, er det på tide at toppledere og datavitenskapsteamene de overvåker migrerer bort fra en mer ad-hoc og reaktiv måte å få arbeidet gjort. Ressurser som dataforskere kan bruke til å generere kontekst, konsistens og større samarbeid, som programvarearbeidsbenker, vil sannsynligvis være avgjørende for suksess i datavitenskap. Til syvende og sist vil prosjekter kreve mindre innsats fra dataviterne, ingeniørene, analytikerne og forskerne, som vil være bedre i stand til å akselerere feltets fortsatte og forbløffende suksess.

 
 
Nahla Davies er programvareutvikler og teknologiskribent. Før hun viet arbeidet sitt på heltid til teknisk skriving, klarte hun – blant annet spennende – å fungere som hovedprogrammerer ved en Inc. 5,000 erfaringsbasert merkevareorganisasjon med kunder som Samsung, Time Warner, Netflix og Sony.

Kilde: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Tidstempel:

Mer fra KDnuggets