Context, consistentie en samenwerking zijn essentieel voor succes in datawetenschap

Bronknooppunt: 1882940

Context, consistentie en samenwerking zijn essentieel voor succes in datawetenschap
Foto door mohamed_hassan op Pixabay

 

De vakgebieden kunstmatige intelligentie (AI) en machinaal leren (ML) zijn eind 2021 niet langer opkomende velden met een onzekere toekomst in het verschiet. AI en ML zijn uitgegroeid tot enorm invloedrijke invloedssferen in de bredere wereld van de datawetenschap, en dat is een feit is meer waar gebleven dan ooit het hele jaar door.

Naarmate AI, ML en vervolgens data science zich blijven uitbreiden, geldt dat ook voor de parameters die het succes van data science-teams kunnen maken of breken. De mogelijkheden om significante en diepgaande inzichten te verkrijgen op het gebied van AI en ML zijn gebaseerd op datawetenschapsteams die groter zijn dan simpelweg รฉรฉn datawetenschapper die met รฉรฉn enkele laptop werkt. Er zijn simpelweg te veel gegevens die moeten worden verzameld, opgeschoond en voorbereid voor analyse โ€“ een proces dat een aanzienlijk deel van de gemiddelde werkdag van een datawetenschapper in beslag neemt โ€“ dat รฉรฉn persoon alleen kan verwerken. 

Moderne datawetenschapsprojecten draaien om belangrijke informatie over datavoorbereiding, eerdere datawetenschapsprojecten en mogelijke manieren om datamodellen in te zetten die met meerdere datawetenschappen moeten worden gedeeld. Daarom is het van cruciaal belang om de redenen te onderzoeken waarom data science-teams context, consistentie en veilige samenwerking van hun data nodig hebben om data science-succes te garanderen. Laten we elk van deze vereisten snel onderzoeken, zodat we beter kunnen begrijpen hoe succes op het gebied van datawetenschap er in de toekomst uit kan zien.

Deel รฉรฉn: Context

 
Ons onderzoek naar toekomstig succes op het gebied van datawetenschap begint met de context: geen proces van iteratieve modelbouw dat berust op try-it-and-fail-experimenten kan lang standhouden zonder institutionele kennis die wordt gedocumenteerd, opgeslagen en beschikbaar gesteld aan datawetenschappers. En toch gaat er regelmatig veel institutionele kennis verloren door een gebrek aan goede documentatie en opslag.

Denk eens aan dit veelvoorkomende scenario: een junior of burgerdatawetenschapper wordt bij een project betrokken om zijn vaardigheden te verbeteren, maar krijgt er kort daarna moeite mee synchrone en asynchrone samenwerking vanwege een gebrek aan context. Deze ad-hocteamleden hebben context nodig om meer te weten te komen over de gegevens waarmee ze omgaan, de mensen die in het verleden problemen hebben aangepakt en hoe eerder werk het huidige projectlandschap heeft beรฏnvloed.

De noodzaak om projecten, datamodellen en hun workflows goed te documenteren, kan een team van datawetenschappers gemakkelijk afleiden, laat staan โ€‹โ€‹een team dat alleen opereert. Leiders kunnen de optie overwegen om dat te doen huur een freelance ontwikkelaar in om hun tijd bij te dragen aan het behoud en de verspreiding van institutionele kennis om de standaard beoordelings- en feedbacksessies van moderne datawetenschapsprojecten te verbeteren. Deze sessies, maar ook softwaresystemen, werkbanken en best practices kunnen het effectiever vastleggen van projectgerelateerde context stroomlijnen, waardoor de vindbaarheid van data van junior- en burgerdatawetenschappers in de toekomst wordt verbeterd.

Succes op het gebied van datawetenschap vereist de gestroomlijnd kennisbeheer en de omringende context. Zonder dit zullen nieuwe, junior- en burgerdatawetenschappers waarschijnlijk moeite hebben met onboarding en de zinvolle bijdrage aan hun projecten, wat er op zijn beurt toe leidt dat teams projecten opnieuw creรซren in plaats van bij te dragen aan eerder werk. 

Deel twee: Consistentie

 
De vakgebieden ML en AI hebben bijgedragen aan fundamentele veranderingen als het gaat om financiรซle dienstverlening, de gezondheids- en levenswetenschappen, en productie; deze industrieรซn zijn echter onderworpen aan aanzienlijke regelgeving. Dit betekent dat een AI-project dat zich afspeelt in een gereguleerde omgeving reproduceerbaar moet zijn met een duidelijk audittraject. Met andere woorden: IT- en bedrijfsleiders die op de een of andere manier betrokken zijn bij een data science-project, moeten dat doen zorgen voor een niveau van gegevensconsistentie als het gaat om de resultaten van hun data science-project. 

IT- en bedrijfsleiders die een betrouwbaar niveau van consistentie kunnen verwachten, kunnen ook meer vertrouwen genieten als het tijd is om de soorten strategische verschuivingen door te voeren die AI mogelijk maakt. Er staat veel op het spel als het gaat om data science-projecten en er worden veel investeringen in geรฏnvesteerd, dus datawetenschappers verdienen een infrastructuur waarin ze kunnen opereren met een gegarandeerd niveau van reproduceerbaarheid. van begin tot eind. Deze volledige reproduceerbaarheid vertaalt zich in de consistentie in data waar topmanagers naar op zoek zijn om te beslissen of een data science-project al dan niet voldoende significant is en in lijn is met hun bedrijfsdoelstellingen.

Deze topmanagers zouden op hun beurt moeten verwachten dat naarmate hun wetenschapsteams zich uitbreiden, ook de noodzakelijke trainingssets en hardwarevereisten zullen toenemen om consistentie in de resultaten van oudere projecten te garanderen. Daarom zijn processen en systemen die helpen bij het beheren van een omgeving een absolute noodzaak voor de uitbreiding van een data science-team. Als een datawetenschapper bijvoorbeeld een laptop gebruikt terwijl een data-ingenieur een andere versie van een bibliotheek draait op een cloud-VM, kan die datawetenschapper zien dat zijn datamodel verschillende resultaten oplevert van de ene machine tot de andere. Het komt erop neer: leidinggevenden moeten ervoor zorgen dat hun gegevensmedewerkers op een consistente manier exact dezelfde softwareomgevingen kunnen delen.

Deel drie: Samenwerking

 
Ten slotte komen we bij het belang van veilige samenwerking. Terwijl bedrijven hun activiteiten blijven verschuiven naar een thuiswerkmodel, realiseren organisaties zich dat samenwerking op het gebied van datawetenschap veel moeilijker is dan persoonlijke samenwerking. Hoewel sommige kerntaken op het gebied van datawetenschap beheersbaar zijn met behulp van รฉรฉn enkele datawetenschap (datavoorbereiding, onderzoek en datamodeliteratie), heeft de meerderheid van de bedrijfsleiders ten onrechte de samenwerking buiten de boot gelaten en vervolgens de productiviteit op afstand belemmerd.

Maar hoe faciliteer je de effectieve coรถrdinatie op afstand tussen projectdeelnemers en de beveiliging van projectgegevens? Het antwoord ligt in deelbare werkbestanden en gegevens met betrekking tot een data science-project waardoor het levensvatbaarder wordt om informatie op afstand te verspreiden. En naarmate de verspreiding van projectgerelateerde gegevens eenvoudiger wordt, geldt dat hoe eenvoudiger het wordt om informatie te delen, des te gemakkelijker het is om samenwerking op afstand te vergemakkelijken. Deelnemers aan een data science-project kunnen cloudgebaseerde tools gebruiken om de beveiliging achter hun onderzoek te versterken. maar te veel leiders hebben de fout gemaakt om samenwerking niet aan te moedigen, waardoor de productiviteit afneemt.

Conclusie

 
De enorme vooruitgang die zich de afgelopen jaren heeft voltrokken op het gebied van datawetenschap is ongekend en ronduit verbazingwekkend. De vooruitgang op het gebied van datawetenschap heeft het voor bedrijven over de hele wereld mogelijk gemaakt om vragen te beantwoorden waarop voorheen weinig of geen direct beschikbare antwoorden bestonden, zonder de innovaties die mogelijk zijn gemaakt door AI en ML. 

Nu de wereld van de datawetenschap echter steeds volwassener wordt en groeit, wordt het tijd dat topmanagers en de datawetenschapsteams waarop zij toezicht houden, overstappen van een meer ad-hoc en reactieve manier om hun werk gedaan te krijgen. Hulpbronnen die datawetenschappers kunnen gebruiken om context, consistentie en betere samenwerking te genereren, zoals softwarewerkbanken, zijn waarschijnlijk essentieel voor het succes van datawetenschap. Uiteindelijk zullen projecten minder inspanning vergen van de datawetenschappers, ingenieurs, analisten en onderzoekers, die beter in staat zullen zijn het aanhoudende en verbazingwekkende succes van het vakgebied te versnellen.

 
 
Nahla Davies is een softwareontwikkelaar en technisch schrijver. Voordat ze haar werk fulltime aan technisch schrijven wijdde, slaagde ze er onder meer in om als hoofdprogrammeur te dienen bij een Inc. 5,000 ervaringsgerichte merkorganisatie met klanten als Samsung, Time Warner, Netflix en Sony.

Bron: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Tijdstempel:

Meer van KDnuggets