A kontextus, a következetesség és az együttműködés elengedhetetlenek az adattudományi sikerhez

Forrás csomópont: 1882940

A kontextus, a következetesség és az együttműködés elengedhetetlenek az adattudományi sikerhez
Fotó mohamed_hassan a Pixabay-en

 

A mesterséges intelligencia (AI) és a gépi tanulás (ML) területei 2021 végén már nem születőben lévő területek, és bizonytalan jövő áll előttük. Az AI és az ML hatalmas befolyási szférává nőtte ki magát az adattudomány tágabb világában, ami tény, hogy igazabb maradt, mint valaha is ebben az évben.

Ahogy azonban az AI, az ML és ezt követően az adattudomány tovább bővült, úgy fejlődtek azok a paraméterek is, amelyek növelhetik vagy megtörhetik az adattudományi csapatok sikerét. A mesterséges intelligencia és az ML területéről jelentős és mélyreható ismeretek megszerzésének lehetőségei olyan adattudományi csapatokon alapulnak, amelyek nagyobbak, mint egy adattudós, amely egyetlen laptoppal dolgozik. Egyszerűen túl sok adatot kell beszerezni, megtisztítani és előkészíteni az elemzéshez – ez a folyamat egy adatkutató átlagos munkanapjának jelentős részét felemészti – ahhoz, hogy bárki egyedül kezelje. 

A modern adattudományi projektek az adat-előkészítéssel kapcsolatos fontos információk, a korábbi adattudományi projektek és a több adattudományokkal megosztandó adatmodellek alkalmazásának lehetséges módjai körül forognak. Ezért alapvető fontosságú annak megvizsgálása, hogy az adattudományi csapatoknak miért van szükségük kontextusra, konzisztenciára és adataik biztonságos együttműködésére az adattudományi siker érdekében. Vizsgáljuk meg gyorsan ezeket a követelményeket, hogy jobban megértsük, hogyan nézhet ki az adattudományi sikerek előrehaladása.

Első rész: Kontextus

 
Az adattudomány jövőbeli sikerének vizsgálata a kontextussal kezdődik: nincs iteratív modellépítési folyamat amely a „próbáld meg és elbukd” kísérletezésen alapul sokáig fennmaradhat olyan intézményi tudás nélkül, amelyet dokumentálnak, tárolnak és az adatkutatók rendelkezésére bocsátanak. Ennek ellenére az intézményi ismeretek nagy része rendszeresen elveszik a megfelelő dokumentáció és tárolás hiánya miatt.

Vegyük fontolóra ezt a gyakori forgatókönyvet: egy fiatal vagy állampolgári adatkutatót bevonnak egy projektbe, hogy fejlesszék készségeiket, de hamarosan megküzd szinkron és aszinkron együttműködés kontextus hiánya miatt. Ezeknek az ad-hoc csapattagoknak kontextusra van szükségük ahhoz, hogy többet tudjanak azokról az adatokról, amelyekkel kölcsönhatásba lépnek, azokról az emberekről, akik a múltban foglalkoztak a problémákkal, és hogy a korábbi munka hogyan befolyásolta a jelenlegi projektkörnyezetet.

A projektek, adatmodellek és munkafolyamataik megfelelő dokumentálásának szükségessége könnyen elvonhatja az adatkutatók csapatának figyelmét, nem is beszélve egy egyedül működő kutatócsoportról. A vezetők fontolóra vehetik a lehetőséget béreljen fel szabadúszó fejlesztőt idejükkel hozzájárulni az intézményi tudás megőrzéséhez és terjesztéséhez a modern adattudományi projektek standard felülvizsgálati és visszacsatolási munkameneteinek javítása érdekében. Ezek a munkamenetek, valamint a szoftverrendszerek, a munkaasztalok és a bevált gyakorlatok egyszerűsíthetik a projekttel kapcsolatos kontextusok hatékonyabb rögzítését, ami javítja a fiatal és állampolgári adatkutatók adatainak felfedezhetőségét a jövőben.

Az adattudományi sikerhez szükséges a ésszerűsített tudásmenedzsment és a környező kontextus. Enélkül az új, fiatal és állampolgári adatokkal foglalkozó tudósok valószínűleg küszködni fognak a bekapcsolódással és a projektjeikhez való érdemi hozzájárulással, ami viszont ahhoz vezet, hogy a csapatok újra létrehozzák a projekteket, ahelyett, hogy hozzájárulnának a korábbi munkához. 

Második rész: Következetesség

 
Az ML és a mesterséges intelligencia területei alapvető változásokhoz járultak hozzá a pénzügyi szolgáltatások, az egészség- és élettudományok, valamint a gyártás területén; ezekre az iparágakra azonban jelentős szabályozási környezet vonatkozik. Ez azt jelenti, hogy egy szabályozott környezetben zajló AI-projektnek reprodukálhatónak kell lennie egyértelmű ellenőrzési nyomvonallal. Más szavakkal, azoknak az informatikai és üzleti vezetőknek, akik valamilyen módon, formában vagy formában részt vesznek egy adattudományi projektben biztosítsa az adatok konzisztenciájának szintjét ha adattudományi projektjük eredményeiről van szó. 

Azok az informatikai és üzleti vezetők, akik megbízható szintű következetességre számíthatnak, nagyobb önbizalmat élvezhetnek, amikor eljön az ideje, hogy olyan típusú stratégiai változtatásokat hajtsanak végre, amelyeket az AI megkönnyít. Rengeteg kockán forognak kockán az adattudományi projektek, és rengeteg befektetés forog rajtuk, így az adattudósok megérdemelnek egy olyan infrastruktúrát, amelyben garantált reprodukálhatóság mellett működhetnek. elejétől a végéig. Ez a teljes reprodukálhatóság az adatok konzisztenciájában nyilvánul meg, amelyet a felső vezetők keresnek annak eldöntésére, hogy egy adattudományi projekt kellően jelentős-e, és összhangban van-e üzleti céljaikkal.

Ezeknek a felső vezetőknek viszont arra kell számítaniuk, hogy tudományos csapataik bővülésével a szükséges képzési készletek és hardverkövetelmények is növekedni fognak, hogy biztosítsák a régebbi projektek eredményeinek konzisztenciáját. Ezért a környezet kezelését segítő folyamatok és rendszerek feltétlenül szükségesek az adattudományi csapat bővítéséhez. Ha például egy adattudós laptopot használ, miközben egy adatmérnök egy felhőalapú virtuális gépen futó könyvtár másik verzióját futtatja, akkor előfordulhat, hogy az adatmodell különböző eredményeket produkál az egyes gépeken. A lényeg: a vezetőknek gondoskodniuk kell arról, hogy az adatban dolgozó munkatársaik következetesen megosszák pontosan ugyanazt a szoftverkörnyezetet.

Harmadik rész: Együttműködés

 
Végül elérkeztünk a biztonságos együttműködés fontosságához. Ahogy a vállalkozások továbbra is az otthoni munkavégzés modelljére helyezik át működésüket, a szervezetek ráébrednek, hogy az adattudományi együttműködés sokkal nehezebb, mint a személyes együttműködés. Bár néhány alapvető adattudományi feladat egyetlen adattudomány segítségével kezelhető (adat-előkészítés, kutatás és adatmodell-iteráció), a vállalatvezetők többsége tévedésből az együttműködést félrehagyta, és ezt követően akadályozta a távoli termelékenységet.

De hogyan lehet elősegíteni a projekt résztvevői közötti hatékony és távoli koordinációt, valamint a projektadatok biztonságát? A válasz a megosztható munkafájlokban és egy adattudományi projekthez tartozó adatokban rejlik amelyek életképesebbé teszik információk távolról történő terjesztésére. És ahogy a projekttel kapcsolatos adatok terjesztése egyszerűbbé válik, minél egyszerűbbé válik az információk megosztása, annál könnyebb a távoli adat-együttműködés megkönnyítése. Az adattudományi projektek résztvevői felhő alapú eszközökkel erősíthetik kutatásaik biztonságát. de túl sok vezető követte el azt a hibát, hogy nem ösztönzi az együttműködést, csökkenti a termelékenységet.

Következtetés

 
Az adattudomány területén az elmúlt években kibontakozó puszta haladás példátlan és őszintén szólva lenyűgöző. Az adattudomány fejlődése lehetővé tette a vállalatok számára világszerte, hogy olyan kérdéseket is megválaszoljanak, amelyekre korábban kevés, vagy egyáltalán nem volt elérhető válasz az AI és az ML által lehetővé tett innovációk nélkül. 

Ahogy azonban az adattudomány világa tovább érik és növekszik, itt az ideje, hogy a felső vezetők és az általuk felügyelt adattudományi csapatok eltérjenek az esetibb és reaktívabb munkavégzési módtól. Azok az erőforrások, amelyeket az adatkutatók a kontextus, a konzisztencia és a nagyobb együttműködés megteremtésére használhatnak, mint például a szoftveres munkapadok, valószínűleg elengedhetetlenek az adattudományi sikerhez. Végső soron a projektek kevesebb erőfeszítést igényelnek az adattudósoktól, mérnököktől, elemzőktől és kutatóktól, akik jobban fel tudják gyorsítani a terület folyamatos és elképesztő sikerét.

 
 
Nahla Davies szoftverfejlesztő és műszaki író. Mielőtt munkáját teljes munkaidőben a műszaki írásnak szentelte volna, sikerült – többek között – vezető programozóként szolgálnia egy Inc. 5,000 tapasztalati márkaépítő szervezetnél, amelynek ügyfelei között szerepel a Samsung, a Time Warner, a Netflix és a Sony.

Forrás: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Időbélyeg:

Még több KDnuggets