
Rollen som dataforsker – en som trekker historier og gjør funn ut av data – ble berømt erklært den «mest sexy jobben i det 21. århundre» i Harvard Business Review tilbake i 2012. For bare to år siden, forfatterne Thomas H. Davenport og DJ Patil, oppdaterte prognosene sine for å observere at dataforskere har blitt mainstream og helt avgjørende for deres virksomhet i en tidsalder av kunstig intelligens og maskinlæring (ML).
Jobbrollen har også utviklet seg, dels til det bedre, dels til det verre. “Det har blitt bedre institusjonalisert, omfanget av jobben har blitt redefinert, teknologien den er avhengig av har gjort store fremskritt, og viktigheten av ikke-teknisk ekspertise, som etikk og endringsledelse, har vokst,” observerer Davenport og Patil.
Også: Forretningssuksess og vekst er avhengig av tillit, data og AI
Samtidig rapporterer dataforskere at “de bruker mye av deres tid på å rense og krangle data, og det er fortsatt tilfelle til tross for noen få fremskritt med å bruke selve AI for forbedringer av dataadministrasjon.”
Enda mer signifikant, “mange organisasjoner har ikke datadrevne kulturer og drar ikke nytte av innsikten fra dataforskere,” finner Davenport og Patil. “Å bli ansatt og godt betalt betyr ikke at dataforskere vil være i stand til å gjøre en forskjell for sine arbeidsgivere. Som et resultat er mange frustrerte, noe som fører til høy turnover.”
Folk respekterer dataforskere, men har en tendens til ikke å følge deres anbefalinger eller innsikt, bekrefter en fersk undersøkelse av 328 analytikere fra Rexer Analytics. Bare 22 % av dataforskerne sier at initiativene deres – modeller utviklet for å muliggjøre en ny prosess eller kapasitet – vanligvis kommer til utrulling, observerer undersøkelsens medforfatter Eric Siegel, tidligere professor ved Columbia University og forfatter av The AI Playbook, i et relatert innlegg hos KDNuggets. Mer enn fire av ti respondenter, 43 %, sier at 80 % eller flere av de nye modellene deres mislykkes.
Selv justering av eksisterende modeller passer ikke i mange tilfeller. “På tvers av alle typer ML-prosjekter – inkludert forfriskende modeller for eksisterende distribusjoner – sier bare 32 % at modellene deres vanligvis distribueres,” legger Siegel til.
Hva er problemet? Samspillet mellom forretnings- og datavitenskapsteamene – eller mangel på slike – ser ut til å være kjernen i mange problemer. Bare 34 % av dataforskerne sier at målene for datavitenskapsprosjekter «vanligvis er veldefinerte før de starter», finner undersøkelsen.
I tillegg kan mindre enn halvparten, 49 %, hevde at ledere og beslutningstakere i deres organisasjoner som må godkjenne modellimplementering “generelt sett er kunnskapsrike nok til å ta slike beslutninger på en velinformert måte.”
< p>Også: Er prompt ingeniør som fortrenger dataforsker som den 'mest sexy jobben i det 21. århundre'?
Samlet sett er de viktigste årsakene nevnt for manglende implementering av anbefalte maskinlæringsmodeller består av følgende:
- Beslutningstakere er ikke villige til å godkjenne endringen av eksisterende operasjoner. Mangel på tilstrekkelig, proaktiv planlegging. Mangel på forståelse av den riktige måten å utføre distribusjon på. Problemer med tilgjengeligheten av dataene som kreves for å score modellen. Ingen tildelt person til steward-distribusjon. Personale som ikke vil eller er i stand til å arbeide effektivt med modellresultater. Tekniske hindringer ved beregning av poeng eller implementering/integrering av modellen eller dens poengsum i eksisterende systemer.
Kampen med å distribuere stammer fra to viktigste medvirkende faktorer, sier Seigel: “Endemisk underplanlegging og forretningsinteressenter som mangler konkret synlighet. Mange datafagfolk og bedriftsledere har ikke innsett at MLs tiltenkte operasjonalisering må planlegges i detalj og forfølges. aggressivt fra starten av hvert ML-prosjekt.”
Bedriftsledere eller fagfolk trenger større synlighet “i nøyaktig hvordan ML vil forbedre sin virksomhet og hvor mye verdi forbedringen forventes å gi,” legger han til. “De trenger dette for til syvende og sist grønt lys for en modells utplassering, samt for å, før det, veie inn i prosjektets utførelse gjennom hele pre-distribusjonsstadiene.”
Betydelig nok blir ML-prosjektets ytelse ofte ikke målt, fortsetter han. Altfor ofte er ytelsesmålingene basert på mystiske tekniske beregninger, kontra forretningsmålinger, for eksempel ROI.
Også: Vil du bli dataforsker? Gjør disse 4 tingene, ifølge bedriftsledere
Allikevel er dataforsker en flott jobb å ha, og den blir stadig bedre, antyder Rexer-undersøkelsen. I den forrige undersøkelsen i 2020 rapporterte 23 % av bedriftsdataforskerne å ha høye nivåer av jobbtilfredshet – en prosentandel som nesten doblet seg til 41 % i denne siste undersøkelsen. Bare 5 prosent uttrykker misnøye, ned fra 12 % i 2020.
Appetitten på ferdigheter innen datavitenskap vokser også fortsatt. Dataforskere fortsetter å være vanskelig å finne — 40 % sier de er bekymret for mangel på talent i bedriftene sine. Halvparten rapporterer at organisasjonene deres har trappet opp intern opplæring for å øke datavitenskapelige ferdigheter, mens 39 % jobber med universiteter for å fremme interessen for datavitenskap.