Kontext, Konsistenz und Zusammenarbeit sind für den Erfolg von Data Science unerlässlich

Quellknoten: 1882940

Kontext, Konsistenz und Zusammenarbeit sind für den Erfolg von Data Science unerlässlich
Photo by mohamed_hassan auf Pixabay

 

Die Bereiche Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) sind am Ende des Jahres 2021 keine aufstrebenden Felder mit ungewisser Zukunft mehr. KI und ML haben sich zu massiv einflussreichen Einflusssphären auf die breitere Welt der Datenwissenschaft entwickelt, eine Tatsache, die ist wahrer geblieben als das ganze Jahr über.

Mit der KI, ML und in der Folge auch der Datenwissenschaft haben sich jedoch auch die Parameter weiterentwickelt, die den Erfolg von Datenwissenschaftsteams ausmachen oder zerstören können. Die Möglichkeiten, signifikante und tiefgreifende Erkenntnisse aus den Bereichen KI und ML zu gewinnen, basieren auf Data-Science-Teams, die größer sind als nur ein Data Scientist, der mit einem einzigen Laptop arbeitet. Es müssen einfach zu viele Daten erfasst, bereinigt und für die Analyse aufbereitet werden – ein Prozess, der einen erheblichen Teil des durchschnittlichen Arbeitstages eines Data Scientists beansprucht –, als dass eine Person alleine damit fertig werden könnte. 

Moderne Data-Science-Projekte drehen sich um wichtige Informationen zur Datenaufbereitung, frühere Data-Science-Projekte und potenzielle Möglichkeiten zur Bereitstellung von Datenmodellen, die mit mehreren Data Sciences geteilt werden müssen. Daher ist es von entscheidender Bedeutung, die Gründe zu untersuchen, warum Data-Science-Teams Kontext, Konsistenz und sichere Zusammenarbeit ihrer Daten benötigen, um den Erfolg von Data Science zu gewährleisten. Lassen Sie uns kurz jede dieser Anforderungen untersuchen, damit wir besser verstehen können, wie der zukünftige Erfolg von Data Science aussehen kann.

Teil eins: Kontext

 
Unsere Untersuchung des zukünftigen Data-Science-Erfolgs beginnt mit dem Kontext: kein Prozess der iterativen Modellbildung das beruht auf Try-it-and-Fail-Experimenten kann lange dauern, ohne dass institutionelles Wissen dokumentiert, gespeichert und Data Scientists zur Verfügung gestellt wird. Und doch geht regelmäßig viel institutionelles Wissen aufgrund fehlender Dokumentation und Aufbewahrung verloren.

Stellen Sie sich dieses häufige Szenario vor: Ein Junior- oder Bürger-Datenwissenschaftler wird in ein Projekt einbezogen, um seine Fähigkeiten zu verbessern, nur um kurz darauf damit zu kämpfen synchrone und asynchrone Zusammenarbeit wegen fehlendem Kontext. Diese Ad-hoc-Teammitglieder benötigen Kontext, um mehr über die Daten zu erfahren, mit denen sie interagieren, die Personen, die sich in der Vergangenheit mit Problemen befasst haben und wie die bisherige Arbeit die aktuelle Projektlandschaft beeinflusst hat.

Die Notwendigkeit, Projekte sowie Datenmodelle und deren Workflows ordnungsgemäß zu dokumentieren, kann ein Team von Data Scientists leicht ablenken, geschweige denn einen einzelnen, der alleine arbeitet. Führungskräfte können die Option in Betracht ziehen, einen freiberuflichen Entwickler einstellen ihre Zeit zur Bewahrung und Verbreitung von institutionellem Wissen beizutragen, um die Standard-Review- und Feedback-Sitzungen moderner Data Science-Projekte zu verbessern. Diese Sitzungen sowie Softwaresysteme, Workbenches und Best Practices können die effektivere Erfassung des projektbezogenen Kontexts optimieren, wodurch die Datenauffindbarkeit von Nachwuchs- und Bürgerdatenwissenschaftlern in Zukunft verbessert wird.

Der Erfolg von Data Science erfordert die Optimiertes Wissensmanagement und seinen umgebenden Kontext. Ohne sie haben neue, junge und bürgerliche Datenwissenschaftler wahrscheinlich Schwierigkeiten mit dem Onboarding und dem sinnvollen Beitrag zu ihren Projekten, was wiederum dazu führt, dass Teams Projekte neu erstellen, anstatt zu früheren Arbeiten beizutragen. 

Zweiter Teil: Konsistenz

 
Die Bereiche ML und KI haben zu grundlegenden Veränderungen in den Bereichen Finanzdienstleistungen, Gesundheit und Biowissenschaften sowie Fertigung beigetragen; diese Branchen unterliegen jedoch erheblichen regulatorischen Rahmenbedingungen. Dies bedeutet, dass ein KI-Projekt, das in einem regulierten Umfeld stattfindet, mit einem klaren Audit-Trail reproduzierbar sein muss. Mit anderen Worten, IT- und Unternehmensleiter, die in irgendeiner Weise an einem Data-Science-Projekt beteiligt sind, müssen Sicherstellen einer Datenkonsistenz wenn es um die Ergebnisse ihres Data-Science-Projekts geht. 

IT- und Unternehmensleiter, die ein zuverlässiges Maß an Konsistenz erwarten können, können auch mehr Vertrauen genießen, wenn es darum geht, die Arten von strategischen Veränderungen vorzunehmen, die KI ermöglicht. Bei Data-Science-Projekten steht viel auf dem Spiel und von ihnen hängt eine Menge Investitionen ab. Daher verdienen Data Scientists eine Infrastruktur, in der sie mit garantierter Reproduzierbarkeit arbeiten können vom Start zum Ziel. Diese vollständige Reproduzierbarkeit führt zu der Konsistenz der Daten, nach der Top-Führungskräfte suchen, um zu entscheiden, ob ein Data-Science-Projekt von ausreichender Bedeutung ist und mit ihren Geschäftszielen in Einklang steht.

Diese Top-Führungskräfte sollten ihrerseits erwarten, dass mit der Erweiterung ihrer Wissenschaftsteams auch die notwendigen Schulungssets und Hardwareanforderungen steigen, um die Konsistenz der Ergebnisse aus älteren Projekten sicherzustellen. Daher sind Prozesse und Systeme, die beim Management einer Umgebung helfen, eine absolute Notwendigkeit für die Erweiterung eines Data-Science-Teams. Wenn beispielsweise ein Data Scientist einen Laptop verwendet, während ein Data Engineer eine andere Version einer Bibliothek auf einer Cloud-VM ausführt, kann dieser Data Scientist feststellen, dass sein Datenmodell von einem Computer zum nächsten unterschiedliche Ergebnisse liefert. Die Quintessenz: Führungskräfte sollten sicherstellen, dass ihre Datenkollaborateure eine konsistente Methode zur gemeinsamen Nutzung der exakt gleichen Softwareumgebungen haben.

Teil XNUMX: Zusammenarbeit

 
Schließlich kommen wir zur Bedeutung einer sicheren Zusammenarbeit. Während Unternehmen ihren Betrieb weiterhin auf ein Work-from-Home-Modell umstellen, erkennen Unternehmen, dass die Zusammenarbeit in der Datenwissenschaft viel schwieriger ist als die persönliche Zusammenarbeit. Obwohl einige Kernaufgaben der Data Science mit Hilfe einer einzigen Data Science (Datenvorbereitung, Forschung und Datenmodelliteration) bewältigt werden können, hat die Mehrheit der Führungskräfte die Zusammenarbeit irrtümlicherweise auf der Strecke gelassen und anschließend die Remote-Produktivität behindert.

Aber wie erleichtert man die effektive Fernkoordination zwischen den Projektbeteiligten sowie die Sicherheit der Projektdaten? Die Antwort liegt in gemeinsam nutzbaren Arbeitsdateien und Daten zu einem Data-Science-Projekt das macht es lebensfähiger Informationen aus der Ferne zu verbreiten. Und je einfacher die Verbreitung projektbezogener Daten wird, desto einfacher ist es, Informationen auszutauschen, desto einfacher ist es, die Datenzusammenarbeit aus der Ferne zu erleichtern. Teilnehmer eines Data-Science-Projekts können Cloud-basierte Tools nutzen, um die Sicherheit ihrer Forschung zu stärken. Aber zu viele Führungskräfte haben den Fehler gemacht, die Zusammenarbeit nicht zu fördern, was die Produktivität verringert.

Zusammenfassung

 
Der schiere Fortschritt, der sich in den letzten Jahren im Bereich der Datenwissenschaft vollzogen hat, war beispiellos und ehrlich gesagt erstaunlich. Der Fortschritt von Data Science hat es Unternehmen weltweit ermöglicht, Fragen zu beantworten, auf die es zuvor nur wenige oder gar keine leicht verfügbaren Antworten gab, ohne die Innovationen, die durch KI und ML ermöglicht wurden. 

Da die Welt der Datenwissenschaft jedoch weiter reift und wächst, ist es an der Zeit, dass Top-Führungskräfte und die von ihnen beaufsichtigten Datenwissenschaftsteams von einer eher ad-hoc- und reaktiven Arbeitserledigung weggehen. Ressourcen, die Data Scientists verwenden können, um Kontext, Konsistenz und eine bessere Zusammenarbeit zu generieren, wie Software-Workbenches, sind wahrscheinlich für den Erfolg der Data Science von entscheidender Bedeutung. Letztendlich werden Projekte weniger Aufwand von den Datenwissenschaftlern, Ingenieuren, Analysten und Forschern erfordern, die den anhaltenden und erstaunlichen Erfolg des Felds besser beschleunigen können.

 
 
Nahla Davis ist Softwareentwickler und Tech Writer. Bevor sie ihre Arbeit ganz der technischen Redaktion widmete, schaffte sie es – neben anderen faszinierenden Dingen – als leitende Programmiererin bei einer erfahrungsorientierten Branding-Organisation von Inc. 5,000 zu arbeiten, zu deren Kunden Samsung, Time Warner, Netflix und Sony zählen.

Quelle: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Zeitstempel:

Mehr von KDnuggets