Kontext, konsekvens och samarbete är avgörande för framgång inom datavetenskap

Återutgiven av Platon

anhängare: 0

Kontext, konsekvens och samarbete är avgörande för framgång inom datavetenskap

Fälten artificiell intelligens (AI) och maskininlärning (ML) är, i slutet av 2021, inte längre begynnande fält med osäkra framtider framför sig. AI och ML har vuxit till att bli enormt inflytelserika sfärer av inflytande på den bredare världen av datavetenskap, ett faktum har förblivit sannare än någonsin under hela detta år.

I takt med att AI, ML och, därefter, datavetenskap har fortsatt att expandera, så har också parametrarna som kan göra eller bryta framgången för datavetenskapsteam. Möjligheterna att få betydande och djupgående insikter från områdena AI och ML bygger på datavetenskapsteam som är större än bara en datavetare som arbetar med en enda bärbar dator. Det är helt enkelt för mycket data som behöver erhållas, rengöras och förberedas för analys – en process som förbrukar en betydande del av en datavetares genomsnittliga arbetsdag – för att en person ska kunna hantera den ensam.

Moderna datavetenskapsprojekt kretsar kring viktig information om dataförberedelse, tidigare datavetenskapliga projekt och potentiella vägar framåt för att distribuera datamodeller som måste delas med flera datavetenskaper. Därför är det avgörande att undersöka orsakerna till att datavetenskapsteam kräver sammanhang, konsekvens och säkert samarbete mellan sina data för att säkerställa framgång inom datavetenskap. Låt oss snabbt undersöka vart och ett av dessa krav så att vi bättre kan förstå hur datavetenskaplig framgång framåt kan se ut.

Del ett: Sammanhang

Vår granskning av framtida framgång inom datavetenskap börjar med sammanhanget: ingen process för iterativ modellbyggnad som förlitar sig på försök-det-och-misslyckas-experiment kan pågå länge utan institutionell kunskap som är dokumenterad, lagrad och tillgänglig för datavetare. Och ändå går en hel del institutionell kunskap regelbundet förlorad på grund av brist på korrekt dokumentation och lagring.

Tänk på det här vanliga scenariot: en yngre eller medborgardataforskare dras in i ett projekt för att förbättra sina färdigheter, bara för att kort efter kämpa med synkront och asynkront samarbete på grund av brist på sammanhang. Dessa ad-hoc-teammedlemmar behöver sammanhang för att veta mer om de data som de interagerar med, de personer som har tagit itu med problem tidigare och hur tidigare arbete påverkat det nuvarande projektlandskapet.

Behovet av att korrekt dokumentera projekt såväl som datamodeller och deras arbetsflöden kan lätt distrahera ett team av datavetare, än mindre en enda som arbetar ensam. Ledare kan överväga alternativet att anställa en frilansutvecklare att bidra med sin tid för att bevara och sprida institutionell kunskap för att förbättra standardgransknings- och feedbacksessionerna för moderna datavetenskapliga projekt. Dessa sessioner såväl som mjukvarusystem, arbetsbänkar och bästa praxis kan effektivisera den mer effektiva fångsten av projektrelaterade sammanhang som förbättrar dataupptäckbarheten för yngre och medborgardataforskare i framtiden.

Datavetenskaplig framgång kräver strömlinjeformad kunskapshantering och dess omgivande kontext. Utan det kommer nya, yngre och medborgardataforskare sannolikt att kämpa med onboarding och det meningsfulla bidraget till sina projekt, vilket i sin tur leder till att team återskapar projekt snarare än att bidra till tidigare arbete.

Del två: Konsekvens

Områdena ML och AI har bidragit till grundläggande förändringar när det gäller finansiella tjänster, hälso- och biovetenskaper samt tillverkning; dessa industrier är dock föremål för betydande reglerande miljöer. Det innebär att ett AI-projekt som sker i en reglerad miljö ska vara reproducerbart med en tydlig revisionsspår. Med andra ord, IT- och företagsledare som på något sätt, form eller form är involverade i ett datavetenskapligt projekt måste säkerställa en nivå av datakonsistens när det kommer till deras datavetenskapsprojekts resultat.

IT- och företagsledare som kan förvänta sig en pålitlig nivå av konsistens kan också njuta av mer självförtroende när det är dags att göra de typer av strategiska förändringar som AI underlättar. Det är mycket som står på spel när det kommer till datavetenskapsprojekt och det finns många investeringar i dem, så dataforskare förtjänar en infrastruktur där de kan arbeta med en garanterad reproducerbarhet Från början till slut. Denna fullständiga reproducerbarhet översätts till konsistensen i data som högsta chefer letar efter för att avgöra om ett datavetenskapligt projekt är tillräckligt betydelsefullt och i linje med deras affärsmål.

Dessa toppchefer bör i sin tur förvänta sig att när deras vetenskapsteam expanderar, så kommer också de nödvändiga utbildningsuppsättningarna och hårdvarukraven att säkerställa konsekvens i resultaten från äldre projekt. Därför är processer och system som hjälper till att hantera en miljö en absolut nödvändighet för en expansion av datavetenskapsteamet. Om, till exempel, en dataforskare använder en bärbar dator medan en dataingenjör kör en annan version av ett bibliotek som körs på en moln-VM, kan den dataforskaren se att deras datamodell ger olika resultat från en maskin till nästa. Summan av kardemumman: chefer bör se till att deras datasamarbetare har ett konsekvent sätt att dela exakt samma mjukvarumiljöer.

Del tre: Samarbete

Slutligen kommer vi till vikten av säker samverkan. När företag fortsätter att ställa om sin verksamhet till en work-from-home-modell, inser organisationer att datavetenskapligt samarbete är mycket svårare än personligt samarbete. Även om vissa kärnuppgifter inom datavetenskap kan hanteras med hjälp av en enda datavetenskap (dataförberedelser, forskning och datamodelliteration), har majoriteten av företagsledare av misstag lämnat samarbetet vid sidan av och har därefter hindrat fjärrproduktivitet.

Men hur underlättar man effektiv och distanssamordning mellan projektdeltagare samt säkerheten för projektdata? Svaret ligger i delbara arbetsfiler och data som hör till ett datavetenskapligt projekt som gör det mer lönsamt att sprida information på distans. Och eftersom spridning av projektrelaterad data blir enklare, ju enklare det blir att dela information, desto lättare är det att underlätta datasamarbete på distans. Deltagare i ett datavetenskapsprojekt kan utnyttja molnbaserade verktyg för att stärka säkerheten bakom sin forskning. men alltför många ledare har gjort misstaget att inte uppmuntra samarbete, vilket minskar produktiviteten.

Slutsats

De stora framstegen som har utvecklats inom datavetenskapens område de senaste åren har varit oöverträffade och uppriktigt sagt fantastiska. Datavetenskapens framsteg har gjort det möjligt för företag över hela världen att ta itu med frågor som tidigare haft få, om några, lättillgängliga svar utan de innovationer som har möjliggjorts av AI och ML.

Men eftersom datavetenskapens värld fortsätter att mogna och växa, är det dags för högsta chefer och datavetenskapsteamen de övervakar att migrera bort från ett mer ad-hoc och reaktivt sätt att få arbetet gjort. Resurser som datavetare kan använda för att skapa sammanhang, konsekvens och bättre samarbete som mjukvaruarbetsbänkar kommer sannolikt att vara avgörande för framgång inom datavetenskap. I slutändan kommer projekt att kräva mindre ansträngning från datavetare, ingenjörer, analytiker och forskare, som bättre kommer att kunna påskynda fältets fortsatta och häpnadsväckande framgång.

Nahla Davies är en mjukvaruutvecklare och teknikskribent. Innan hon ägnade sitt arbete heltid åt tekniskt skrivande lyckades hon – bland annat spännande – att fungera som ledande programmerare på en Inc. 5,000 XNUMX erfarenhetsbaserad varumärkesorganisation vars kunder inkluderar Samsung, Time Warner, Netflix och Sony.

Källa: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Tidsstämpel: Januari 12, 2022