Kontekst, doslednost in sodelovanje so bistveni za uspeh podatkovne znanosti

Izvorno vozlišče: 1882940

Kontekst, doslednost in sodelovanje so bistveni za uspeh podatkovne znanosti
Foto: mohamed_hassan na Pixabayu

 

Področji umetne inteligence (AI) in strojnega učenja (ML) ob koncu leta 2021 nista več področji v nastajanju z negotovo prihodnostjo. AI in ML sta zrasla v izjemno vplivni sferi vpliva na širši svet podatkovne znanosti, kar je dejstvo, je ostal bolj resničen kot vse to leto.

Ko so se AI, ML in posledično podatkovna znanost še naprej širili, so se širili tudi parametri, ki lahko prispevajo ali zaničijo uspeh skupin za podatkovno znanost. Priložnosti za pridobitev pomembnih in globokih vpogledov s področij umetne inteligence in strojnega upravljanja temeljijo na skupinah za podatkovno znanost, ki so večje od enega podatkovnega znanstvenika, ki deluje z enim prenosnim računalnikom. Enostavno je preveč podatkov, ki jih je treba pridobiti, očistiti in pripraviti za analizo – proces, ki porabi velik del povprečnega delovnega dne podatkovnega znanstvenika –, da bi jih lahko obravnavala ena oseba sama. 

Sodobni projekti znanosti o podatkih se vrtijo okoli pomembnih informacij o pripravi podatkov, predhodnih projektih znanosti o podatkih in možnih načinih za uvedbo podatkovnih modelov, ki jih je treba deliti z več znanostmi o podatkih. Zato je ključnega pomena raziskati razloge, zakaj ekipe za podatkovno znanost potrebujejo kontekst, doslednost in varno sodelovanje svojih podatkov, da zagotovijo uspeh podatkovne znanosti. Na hitro preučimo vsako od teh zahtev, da bomo lahko bolje razumeli, kako bi lahko izgledal napredek v znanosti o podatkih.

Prvi del: Kontekst

 
Naše preverjanje prihodnjega uspeha podatkovne znanosti se začne s kontekstom: brez procesa iterativne gradnje modela ki se opira na poskuse poskusi in spodleti lahko traja dolgo brez institucionalnega znanja, ki je dokumentirano, shranjeno in dano na voljo podatkovnim znanstvenikom. In kljub temu se veliko institucionalnega znanja redno izgubi zaradi pomanjkanja ustrezne dokumentacije in shranjevanja.

Razmislite o tem običajnem scenariju: mlajši podatkovni znanstvenik ali državljan je vključen v projekt, da bi izboljšal svoje veščine, kmalu zatem pa se spopade z sinhrono in asinhrono sodelovanje zaradi pomanjkanja konteksta. Ti ad hoc člani ekipe potrebujejo kontekst, da bi vedeli več o podatkih, s katerimi so v interakciji, o ljudeh, ki so se v preteklosti ukvarjali s težavami, in o tem, kako je prejšnje delo vplivalo na trenutno pokrajino projekta.

Potreba po pravilnem dokumentiranju projektov ter podatkovnih modelov in njihovih delovnih tokov lahko zlahka zmoti ekipo podatkovnih znanstvenikov, kaj šele enega, ki deluje sam. Voditelji lahko razmislijo o možnosti najemite samostojnega razvijalca da prispevajo svoj čas k ohranjanju in razširjanju institucionalnega znanja za izboljšanje standardnega pregleda in povratnih informacij sodobnih projektov podatkovne znanosti. Te seje, kot tudi sistemi programske opreme, delovne mize in najboljše prakse lahko racionalizirajo učinkovitejši zajem konteksta, povezanega s projektom, ki izboljša odkrivanje podatkov mladinskih in državljanskih podatkovnih znanstvenikov v prihodnosti.

Uspeh znanosti o podatkih zahteva poenostavljeno upravljanje znanja in njegov okoliški kontekst. Brez tega se bodo novi, mlajši in državljanski podatkovni znanstveniki verjetno borili z vključevanjem in pomembnim prispevkom k svojim projektom, kar posledično vodi do tega, da ekipe znova ustvarjajo projekte, namesto da bi prispevale k prejšnjemu delu. 

Drugi del: Doslednost

 
Področji strojnega upravljanja in umetne inteligence sta prispevali k temeljnim spremembam, ko gre za finančne storitve, zdravje in znanosti o življenju ter proizvodnjo; te panoge pa so podvržene pomembnim regulativnim okoljem. To pomeni, da mora biti projekt umetne inteligence, ki poteka v reguliranem okolju, ponovljiv z jasno revizijsko sledjo. Z drugimi besedami, IT in poslovni vodje, ki so na nek način, obliko ali obliko vključeni v projekt podatkovne znanosti, morajo zagotoviti raven konsistentnosti podatkov ko gre za rezultate njihovega podatkovnega projekta. 

IT in vodje podjetij, ki lahko pričakujejo zanesljivo raven doslednosti, lahko uživajo tudi več zaupanja, ko pride čas za izvedbo tipov strateških premikov, ki jih omogoča umetna inteligenca. Ko gre za projekte podatkovne znanosti, je veliko na kocki in v njih je povezanih veliko naložb, zato si podatkovni znanstveniki zaslužijo infrastrukturo, v kateri lahko delujejo z zajamčeno stopnjo ponovljivosti. od začetka do konca. Ta popolna ponovljivost pomeni doslednost podatkov, ki jih najvišje vodstvo išče, da se odločijo, ali je projekt podatkovne znanosti dovolj pomemben in v skladu z njihovimi poslovnimi cilji.

Ti najvišji vodstveni delavci bi morali po drugi strani pričakovati, da se bodo s širitvijo njihovih znanstvenih skupin razširili tudi potrebni sklopi usposabljanja in zahteve glede strojne opreme, da se zagotovi doslednost rezultatov starejših projektov. Zato so procesi in sistemi, ki pomagajo pri upravljanju okolja, absolutno nujni za širitev ekipe podatkovne znanosti. Če na primer podatkovni znanstvenik uporablja prenosni računalnik, medtem ko podatkovni inženir izvaja drugo različico knjižnice, ki se izvaja na navideznem računalniku v oblaku, lahko ta podatkovni znanstvenik vidi, da njihov podatkovni model ustvarja različne rezultate od enega do drugega računalnika. Zaključek: vodstveni delavci bi morali zagotoviti, da imajo njihovi podatkovni sodelavci dosleden način souporabe popolnoma istih programskih okolij.

Tretji del: Sodelovanje

 
Končno pridemo do pomena varnega sodelovanja. Medtem ko podjetja še naprej preusmerjajo svoje poslovanje na model dela od doma, se organizacije zavedajo, da je sodelovanje v znanosti o podatkih veliko težje kot osebno sodelovanje. Čeprav so nekatere temeljne naloge podatkovne znanosti obvladljive s pomočjo ene same podatkovne znanosti (priprava podatkov, raziskave in ponovitev podatkovnega modela), je večina poslovnih direktorjev pomotoma pustila sodelovanje ob strani in posledično ovirala produktivnost na daljavo.

Toda kako omogočiti učinkovito in oddaljeno koordinacijo med udeleženci projekta ter varnost projektnih podatkov? Odgovor je v delovnih datotekah, ki jih je mogoče deliti, in podatkih, ki se nanašajo na projekt podatkovne znanosti ki ga naredijo bolj sposobnega preživetja za širjenje informacij na daljavo. In ko postaja razširjanje podatkov, povezanih s projektom, enostavnejše, preprostejša ko postane izmenjava informacij, lažje je olajšati sodelovanje pri podatkih na daljavo. Udeleženci projekta podatkovne znanosti lahko izkoristijo orodja v oblaku, da okrepijo varnost svojih raziskav. vendar je preveč voditeljev naredilo napako, ker niso spodbujali sodelovanja, kar je zmanjšalo produktivnost.

zaključek

 
Sam napredek, ki se je v zadnjih letih zgodil na področju podatkovne znanosti, je bil brez primere in odkrito neverjeten. Napredovanje znanosti o podatkih je podjetjem po vsem svetu omogočilo, da obravnavajo vprašanja, na katera je prej bilo le malo, če sploh, brez inovacij, ki sta jih omogočila AI in ML. 

Ker pa svet podatkovne znanosti še naprej dozoreva in raste, je čas, da najvišji vodstveni delavci in ekipe za podatkovno znanost, ki jih nadzorujejo, preidejo stran od bolj ad hoc in reaktivnega načina opravljanja dela. Viri, ki jih podatkovni znanstveniki lahko uporabijo za ustvarjanje konteksta, doslednosti in večjega sodelovanja, kot so delovne mize programske opreme, bodo verjetno bistveni za uspeh podatkovne znanosti. Konec koncev bodo projekti zahtevali manj truda od podatkovnih znanstvenikov, inženirjev, analitikov in raziskovalcev, ki bodo lahko bolje pospešili nadaljnji in osupljivi uspeh tega področja.

 
 
Nahla Davies je razvijalec programske opreme in tehnični pisec. Preden se je posvetila svojemu delu s polnim delovnim časom tehničnemu pisanju, ji je med drugimi zanimivimi stvarmi uspelo delati kot vodilna programerka v organizaciji Inc. 5,000 Experiential Branding, katere stranke so Samsung, Time Warner, Netflix in Sony.

Vir: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Časovni žig:

Več od KDnuggets