Jobtendenser i dataanalyse: Del 2 - KDnuggets

Jobtendenser i dataanalyse: Del 2 – KDnuggets

Kildeknude: 2392905

Af Andrea De Mauro og Mahantesh Pattadkal

 
Da vi fortsætter, hvor vi slap i del 1 af blogserien "Jobtendenser i dataanalyse“, fortsætter vores rejse gennem verden af ​​dataanalyse jobtrends og rollen som Natural Language Processing (NLP).
 

I del 1 introducerede vi "Data Analytics jobtendenser” applikation, som handler om at indsamle data og anvende NLP til at analysere dem, drevet af KNIME Analytics-platform. Vi diskuterede web-skrabningsfasen, der blev brugt til at indsamle live-data vedrørende dataanalyse-arbejdsmarkedet, efterfulgt af processen med at rydde op i data ved hjælp af NLP-teknikker. Vi introducerede derefter en emnemodel, der afslørede syv homogene færdigheder inden for jobopslag. Sådanne færdigheder repræsenterer de kompetencer og aktiviteter, som arbejdsgivere på tværs af forskellige brancher søger hos fagfolk inden for dataanalyse.

I anden del af blogserien vil vi beskrive de identificerede færdigheder og gøre nogle dataunderbyggede overvejelser om det udviklende landskab af professionelle karrierer inden for datavidenskab.

 
For at mærke kompetencesættene bruger vi de hyppigste termer og vægte identificeret gennem LDA-algoritmen, som tidligere blev anvendt på stillingsopslagene. Vi analyserer yderligere jobbeskrivelserne i hvert emne for at fremhæve de vigtigste aktiviteter, væsentlige færdigheder og brancher, hvor de oftest findes. At forstå disse emner kan hjælpe jobsøgende med at tilpasse deres færdigheder til markedets krav og øge deres chancer for at sikre sig en passende position inden for dataanalyse. I de følgende afsnit finder du en kort beskrivelse af hvert færdighedssæt.

Emne 0: Forskning og dataanalyse

 
Følgende tabel viser de fem øverste led og deres vægte for emne 0. Vægtene refererer til betydningen af ​​udtrykket for at definere det pågældende emne. I betragtning af disse termer og de dokumenter, der er mærket som emne 0, fortolker vi dette færdighedssæt til at være "Forskning og dataanalyse".

Semester Vægt
Forskning 4510
Position 4195
Information 4112
Helse 3404
Universitet 2118

Tabel 0: Term-vægte for emne 0
 

Dette færdighedssæt omfatter aktiviteter som at udføre forskning, analysere data og give indsigt, der driver beslutningstagning i forskellige sektorer. Som en hjørnesten i dataanalyse letter dette færdighedssæt udvinding af værdifuld indsigt fra data, trendidentifikation og informeret beslutningstagning.
Ud fra det, vi har samlet inden for korpuset af jobstillinger, er de grundlæggende kompetencekrav forbundet med dette færdighedssæt:

  • Stærke analytiske og problemløsningsevner
  • Ekspertise i statistisk software (R, Python) 
  • Erfaring med værktøjer til datavisualisering
  • Effektive kommunikations- og dokumentationsevner
  • En baggrund inden for relevant felt (matematik, statistik eller datavidenskab)

Emne 1: Administration og kundesupport

Ved at se på vilkårene og vægtene fra tabel 1 og på dokumenterne knyttet til emne 1, besluttede vi at mærke det som "Administration og kundesupport". Dette færdighedssæt indebærer styring af kundeinteraktioner, yde administrativ support og koordinering af logistik- eller indkøbsprocesser.

Semester Vægt
Support 2321
Management 2307
Information 2134
Position 2126
Kunden 1909

Tabel 1: Term-vægte for emne 1
 

Efter vores mening er de grundlæggende kompetencer, der er nødvendige for at få succes i job, der kræver dette færdighedssæt:

  • Stærke organisatoriske og tidsstyringsevner
  • Opmærksomhed til detaljer
  • Kendskab til kontorsoftware og kommunikationsværktøjer
  • Fremragende interpersonelle og problemløsningsevner

Emne 2: Marketing og produktledelse

Baseret på de udtryk, der er vist i tabel 2, fortolker vi dette til at være " Marketing og produktledelse " Færdigheder.

Semester Vægt
Forretning 8487
Team 8021
Produkt 6825
Kunden 3923
Marketing 3740

Tabel 2: Term-vægte for emne 2
 

Dette færdighedssæt kredser om udvikling af marketingstrategier, styring af produktlivscyklusser og kørsel af markedsvækst. Det er afgørende i dataanalyse-fokuserede job, da det giver fagfolk mulighed for at bruge datadrevet indsigt til at træffe informerede beslutninger vedrørende markedstendenser, kundepræferencer og produktydelse.

De væsentlige kompetencer, der kræves inden for marketing- og produktledelseskompetencerne er:

  • Stærke analytiske og strategiske tænkeevner
  • Ekspertise inden for markedsundersøgelser og konkurrencemæssig intelligens
  • Erfaring med marketingværktøjer og platforme
  • Fremragende kommunikations- og ledelsesevner
  • En baggrund inden for forretning, marketing eller et beslægtet område

Emne 3: Business Management, Data Governance og Compliance

Baseret på vilkårene vist i tabel 2 konkluderede vi, at det refererede til "Business Management, Data Governance og Compliance " Færdigheder.

Dette færdighedssæt omfatter overvågning af forretningsdrift, sikring af datakvalitet og sikkerhed og styring af risici og regulatoriske krav. I dataanalyse-intensive job muliggør dette færdighedssæt opretholdelse af dataintegritet, overholdelsesovervågning, risikoidentifikation og forretningsprocesoptimering ved hjælp af datadrevet indsigt.

Semester Vægt
Forretning 14046
Management 10531
Team 5835
Analyse 5672
Projekt 4309

Tabel 3: Term-vægte for emne 3
 

Ifølge vores resultater er de nødvendige kompetencer inden for dette færdighedssæt:

  • Stærke organisatoriske og ledelsesmæssige evner
  • Ekspertise inden for datastyring, datagovernance og risikovurdering
  • Erfaring med regulatoriske rammer og industristandarder
  • Effektive kommunikations- og problemløsningsevner
  • En baggrund inden for forretning, finans eller et beslægtet felt

Emne 4: Business Intelligence og datavisualisering

Ser vi på de termer, vi fandt i emne 4, kalder vi det "Business Intelligence og datavisualisering" Færdigheder.

Dette færdighedssæt involverer at designe altid tilstedeværende BI-løsninger såsom dashboards og rapporter, skabe indsigtsfulde visualiseringer og analysere data til informeret beslutningstagning. Det er afgørende i jobs, der udnytter dataanalyse og transformerer rå data til handlingsorienteret indsigt, der driver strategiske beslutninger.

Semester Vægt
Forretning 19372
Analyse 7687
Power bi 7359
intelligens 7040
Sql  5836

Tabel 4: Term-vægte for emne 4
 

Efter vores vurdering er de grundlæggende kompetencekrav inden for BI og datavisualisering:

  • Stærke analytiske og problemløsningsevner
  • Ekspertise i BI-værktøjer (som Power BI, Tableau, SQL)
  • Erfaring med datavisualiseringsteknikker
  • Effektive kommunikations- og fortælleevner

Emne 5: Data Warehouse og Cloud Infrastruktur

Baseret på de udtryk, der er vist i tabel 5, fortolker vi dette til at være "Data Warehouse og Cloud Infrastruktur " Færdigheder.

Jobstillinger, der kræver et cloud- og big data engineering-kompetencesæt, er typisk forbundet med aktiviteter såsom design og implementering af cloud-baserede løsninger, styring af databehandling i stor skala og udvikling af softwareapplikationer. Det er afgørende i dataanalyse-fokuserede job, hvilket muliggør effektiv behandling og analyse af store datamængder for værdifuld indsigt.

Semester Vægt
Udvikling 4525
Cloud 3998
Engineering 3692
Software 3510
Design 3494

Tabel 5: Term-vægte for emne 5
 

Efter vores opfattelse er de grundlæggende kompetencekrav relateret til kompetencer 

  • Stærke programmerings- og problemløsningsevner
  • Ekspertise inden for cloud-platforme (som AWS, Azure og Google Cloud)
  • Erfaring med big data-teknologier (som Hadoop, Spark og NoSQL-databaser)
  • Kendskab til informationssikkerhedspolitikker og relaterede processer

Emne 6: Machine Learning

Baseret på de udtryk, der er vist i tabel 6, fortolker vi dette til at være "Maskinelæring ” færdighedssæt, som kredser om at designe AI-modeller, forske i banebrydende ML-teknikker og udvikle intelligente softwareløsninger. I dataanalyse-intensive job danner det grundlaget for AI-modeltræning og præstationsoptimering.

Semester Vægt
Maskine 9782
Videnskab 8861
Forskning 4686
Computer 4209
Python 4053

Tabel 6: Term-vægte for emne 6
 

Ifølge vores resultater er de grundlæggende kompetencer, der kræves inden for maskinlæring i dag

  • Stærke programmerings- og matematiske evner
  • Ekspertise i maskinlæringsrammer (som TensorFlow, PyTorch)
  • Erfaring med avancerede AI-teknikker (som deep learning og naturlig sprogbehandling)
  • Effektive kommunikations- og samarbejdsevner 

 
I denne udgave vender vores fokus sig mod den indviklede analyse af kompetencesammenslutninger, som afsløret gennem emnemodellering på tværs af tre forskellige professionelle profiler: dataingeniør, dataanalytiker og dataforsker. For at tilpasse disse professionelle profiler til stillingsopslag, har vi udnyttet en regelbaseret klassificering. Denne klassificering formåede at bestemme profilbetegnelsen for en stillingsopslag baseret på søgeord fundet i stillingsbetegnelsen. For eksempel vil et jobopslag med titlen "Data Architect" blive kategoriseret som en Data Engineer-rolle, mens et opslag med titlen "Machine Learning Engineer" vil blive tilskrevet kategorien Data Scientist. 

Brug af Latent Dirichlet Allocation (LDA) emnemodellering giver os emnevægte for hvert jobopslag, der spænder over syv forskellige færdigheder. Ved at beregne gennemsnitsvægten af ​​hvert færdighedssæt på tværs af alle professionelle profiler, når vi frem til den gennemsnitlige færdighedsvægt, der er specifik for hver rolle. Det er bemærkelsesværdigt, at disse vægte derefter normaliseres og repræsenteres som procenter.

Som illustreret i figur 1 præsenterer vi en indsigtsfuld visualisering af samspillet mellem professionelle betegnelser og tilsvarende færdighedssæt. Denne visualisering indkapsler arbejdsgivernes kollektive forventning om de grundlæggende færdigheder, der er afgørende for dataingeniører, dataanalytikere og dataforskere.

Som forventet kræver rollen som dataingeniør fremtrædende beherskelse i "Data Warehouse & Cloud Infrastructure"-færdighedssættet. Desuden er en supplerende forståelse af visualisering og maskinlæring bydende nødvendigt. Denne vægt på mangfoldighed af færdigheder kan tilskrives forventningen om, at dataingeniører vil være en integreret del af støtten til både dataanalytikere og dataforskere.

Omvendt ligger den altoverskyggende ekspertise, der forventes for dataforskere, i "Machine Learning", tæt efterfulgt af en færdighed i "Research"-metoder. Et hybridt færdighedssæt, der omfatter "Business Management" og "Product Management" rangerer også højt i betydning. Dette indkapsler den indviklede række af kompetencer, som arbejdsmarkedet søger for håbefulde dataforskere.

Når vi vender vores opmærksomhed mod dataanalytiker-domænet, dukker et afgørende krav op for færdigheder i "BI og visualisering." I betragtning af deres rolle i at generere forretningsrapporter, køre dashboards og overvåge virksomhedens vitalitet, kommer dette ikke som nogen overraskelse. Den parallelle efterspørgsel efter "Business Management" som en sekundær nøglefærdighed afspejler den strategiske indsigt, der forventes af denne rolle. Desuden er der, i lighed med rollen som Data Scientist, et parallelt krav om "Produktstyring" og "Research" færdigheder inden for Data Analyst-spektret.

Sammenfattende understreger denne udforskning det nuancerede landskab af færdighedsforudsætninger på tværs af forskellige Data Analytics-roller. Den skildrer arbejdsgivernes mangefacetterede forventninger til kandidater, der ønsker at udmærke sig i egenskaberne som dataingeniører, dataanalytikere og dataforskere.

 

Figur 1: Radar-plottet viser sammenhængen mellem professionelle profiler plottet mod de færdighedssæt, der er vist i dimensioner.
Figur 1: Radar-plottet viser sammenhængen mellem professionelle profiler plottet mod de færdighedssæt, der er vist i dimensioner (klik for at forstørre).
 

 
Vores analyse af jobopslag inden for det ekspanderende område af Data Analytics har til formål at kategorisere job baseret på forskellige færdigheder og tydeliggøre den mangfoldige række af evner, der kræves i hver kategori. Med eksponentiel vækst i dette domæne og den kritiske karakter af beslutninger, der er truffet baseret på data, har processen med indsamling, lagring og analyse af data set bemærkelsesværdige fremskridt, hvilket fører til en umættelig efterspørgsel efter fagfolk, der er dygtige til dataanalyse.

Gennem klassificeringen af ​​jobopslag i syv bemærkelsesværdige færdighedsemner, kaster vi lys over nødvendigheden af ​​både specialiserede og mangefacetterede færdigheder inden for dette hastigt skiftende felt. Emnerne spændte fra dataanalyse og business intelligence til maskinlæring og kunstig intelligens, hvilket understreger den stigende efterspørgsel efter enkeltpersoner, der er dygtige til at udnytte data, teknologi og tværfunktionelt teamwork.

Ikke desto mindre har denne undersøgelse flere begrænsninger. Arbejdsmarkedets dynamiske karakter og fremkomsten af ​​nye teknologier og metoder kræver løbende opdatering af vores analyse i forhold til et statisk "øjebliksbillede", som vi gjorde her. Desuden har vores tilgang muligvis ikke fanget alle nuancer af de forskellige jobroller og færdigheder i Data Analytics-arenaen, i betragtning af afhængigheden af ​​tilgængelige jobopslag på forskningstidspunktet.

Alt vores arbejde er frit tilgængeligt kl KNIME Community Hub Public Space – "Ansøgning om jobkompetence". Du kan downloade og lege med arbejdsgangene for at prøve og opdage selv og udvide eller forbedre. 

 
 

 
Ser vi fremad, ser vi potentialet for en betydelig udvidelse af denne undersøgelse. Dette inkluderer udviklingen af ​​KNIME-komponenter til at implementere 'Stopsætningsfjernelse'-metoden, beskrevet i del 1, og en human-in-the-loop interaktiv visualiseringsramme i KNIME. En sådan ramme ville forenkle processen med menneskelig dømmekraft ved udvælgelsen af ​​den mest sammenhængende emnemodel for et givent korpus, hvilket forbedrer skaleringen af ​​vores arbejde. Vi forestiller os også anvendelsen af ​​LLM-støttede mekanismer til at understøtte og forenkle emnemodelleringsfasen: dette scenarie giver helt sikkert plads til yderligere eksperimenter og forskning.

Fagfolk inden for dataanalyse-området skal forblive informerede og tilpasningsdygtige i forhold til nye teknologier. Dette sikrer, at deres færdigheder forbliver relevante og værdifulde i det stadigt skiftende landskab af datadrevet beslutningstagning. Ved at anerkende og dyrke de færdigheder, der er relateret til de identificerede emner, kan jobsøgende opnå en konkurrencefordel på dette pulserende marked. For at beskytte deres relevans i feltet skal Data Analytics-professionelle forblive nysgerrige gennem hele deres karriere og fortsætte med at lære kontinuerligt.

 
 
Mahantesh Pattadkal bringer mere end 6 års erfaring med rådgivning om data science projekter og produkter. Med en kandidatgrad i datavidenskab skinner hans ekspertise inden for Deep Learning, Natural Language Processing og Explainable Machine Learning. Derudover engagerer han sig aktivt i KNIME Community for samarbejde om datavidenskabsbaserede projekter.
 

Andrea De Mauro har over 15 års erfaring med at opbygge business analytics og data science teams hos multinationale virksomheder som P&G og Vodafone. Ud over sin virksomhedsrolle nyder han at undervise i Marketing Analytics og Applied Machine Learning på flere universiteter i Italien og Schweiz. Gennem sin forskning og forfatterskab har han udforsket den forretningsmæssige og samfundsmæssige påvirkning af data og AI, overbevist om, at en bredere analytisk forståelse vil gøre verden bedre. Hans seneste bog er 'Data Analytics Made Easy', udgivet af Packt. Han optrådte på CDO-magasinets 2022 globale 'Forty Under 40'-liste.

Tidsstempel:

Mere fra KDnuggets