DANSK

Drejning af store data til forretningsmæssig indsigt: status

184

Nul

Vi lever i en stadig mere data-drevet samfund, hvor information er blevet så meget af en valuta som penge. Mange forbrugere bruger gratis service fra internet-giganter som Google, Facebook, Amazon, Microsoft og Apple, for eksempel, og til gengæld give disse selskaber til at spore og tjene penge på deres online adfærd.

Et af de største problemer i dag er åbenhed i sådanne transaktioner, og den grad af kontrol, at personer over den skæbne, de personlige oplysninger, de — nogle gange uforvarende — videregive til organisationer, som de interagerer online. Nye stemmer på begge sider af Atlanten har fremhævet kapacitet til data-kyndige organisationer til hoover op og profil store mængder af brugerens data-herunder demografi, forbruger-adfærd og internet aktivitet-for at mikro-målrette reklamer, nyheder og tjenester til støtte af særlige mål eller formål.

Det er klart, data sluserne er nu åbne for virksomheder af alle størrelser og beskrivelser, hvilket bringer utallige muligheder for rettidig analyse i forfølgelsen af konkurrencemæssig fordel. Selv om fokus er i øjeblikket hælder i retning af kundernes adfærd, data er tilgængelig på flere punkter i det produkt eller den service, supply chain, og kommer i mange former — traditionelle (strukturerede), ad hoc (ustruktureret), real time, og IoT – eller M2M-genereret, for blot at nævne et par stykker.

Virksomheder, der gennemfører big data analytics med succes kan høste store gevinster fra omkostningsbesparende effektivitet og indtægtsskabende innovationer. Dette kan hjælpe virksomhederne med at opnå en digital transformation, der giver dem mulighed for at opretholde konkurrenceevnen i lyset af eventuelle forstyrrende nystartede — der er data-drevet næsten per definition — der dukker op på deres markeder.

Dog nyttigt business insights ikke automatisk strøm fra en torrent af heterogene oplysninger: aktive data skal identificeres, organiseret og analyseret, og resultater, der gennemføres på tværs af relevante dele af virksomheden. Det kræver planlægning, budget og de rigtige værktøjer og ekspertise.

Denne oversigt, og den resterende del af denne ZDNet særlig rapport, undersøger den den aktuelle situation i big data analytics. Vi kan have bestået ‘peak hype’ om emnet — analysefirmaet Gartner faldt Big Data fra sin Hype Cycle for Emerging Technologies tilbage i 2015-men har det endnu ikke er leveret på sit løfte?

Hvor meget data?

Forsøg der foretages løbende at vurdere, hvor meget data, der er genereret på verdensplan hvert år, og i hvilken form. Tilbage i 2014, IDC og EMC sætte den Digitale Univers på 4,4 zettabytes (ZB) i 2013 — 4.4 milliarder gigabytes — og forudsagt at dette ville vokse til 44ZB i 2020, hvilket er mere end en fordobling hvert andet år. Den seneste opgørelse fra IDC og Seagate ‘s Data Alder 2025 rapport, sætter 2025 figur (nu døbt “den Globale Datasphere’) på 163ZB — en tidobling stige fra 16.1 ZB skabt i 2016.

Billede: IDC/Seagate

IDC/Seagate rapport forudsiger også, at hovedparten af data over hele verden skabelse, vil skift fra forbrugerne til virksomheder, sidstnævnte tegner sig for 60 procent i 2025. Tendenser kørsel dette skift, ifølge rapporten, kan nævnes: udvikling af data fra business-baggrund til livet-kritisk, indlejrede systemer og IoT; kognitiv/AI systemer, der ændrer landskabet; mobil-og real-time data og sikkerhed, som et afgørende fundament.

Alle data behov for et hjem, enten permanent eller midlertidig, hvilket forklarer den interesse af en storage firma, som Seagate i dette område.

I en erklæring lancering af rapporten, Seagate CEO Steve Luczo (snart til at blive Executive-Formand) sagde: “Mens vi kan se fra denne nye forskning, at den æra af Store Data, der er over os, værdien af data er virkelig ikke i ‘kendt’, men i ‘ukendt’, hvor vi er enormt, at man undervurderer potentialer i dag. Hvad der er rigtig spændende er analytics, nye virksomheder, nye tanker og nye økosystemer fra industrier som robotteknologi og maskine-til-maskine-læring, og deres dybe sociale og økonomiske indvirkning på vores samfund. Mulighed for dagens virksomheder og morgendagens iværksættere til at fange værdien af data er enorm, og vores globale virksomhedsledere vil være at udforske disse muligheder i de kommende årtier.”

Hvilke data?

Konfronteret med ufattelige mængder af data, CxOs kan blive tilgivet for at føle sig overvældet. Men, naturligvis, at ikke alle data er egnet eller tilgængeligt for analyse. I de Data, Alder 2025 rapport, for eksempel, IDC anslår, at der i 2025 omkring 20 procent af data i den globale datasphere vil være afgørende for, at vores daglige liv, og 10 procent af de, der vil være ‘strenge’:

Billede: IDC/Seagate

Rapporten konstaterer, at: “fremkomsten af strenge data, der skal tvinge virksomheder til at udvikle og installere datafangst, analytics, og den infrastruktur, som giver ekstremt høj pålidelighed, båndbredde og tilgængelighed, mere sikre systemer, nye forretningsmetoder, og selv nye juridiske infrastruktur til at mindske eksponering til at flytte og potentielt invaliderende forpligtelser.”

AI og machine learning i stigende grad vil blive involveret i big data-analyse, der yderligere begrænser mængden af tilgængelig data. I de Data, Alder 2025 rapport, IDC anslår, at der ved udgangen af 2025 kun 15 procent af de data, der i den globale datasphere vil blive mærket — og derfor velegnet til AI/ML analyse — og kun 20 procent af at 3% af det samlede antal) faktisk vil blive analyseret af kognitive systemer:

Billede: IDC/Seagate

Big Data trends & forudsigelser

Ved begyndelsen af hvert år, og eksperter inden for en bred vifte af tech felter tilbyde deres beskrivelser af aktuelle tendenser og gøre forudsigelser for de næste 12 måneder. Big data ” er ingen undtagelse, og vi har sorteret flere 2017 bidrag, tildeling af forudsigelser på en række nye kategorier. Her er, hvordan et udsnit af de orakel samfund set the big data liggende, så 2017 kom i gang:

Forudsigelser fra: Acodez, Big Data, Datafloq, Datameer, Enterra Løsninger, Gartner, HP Enterprise, IBM, Infogix, MapR, Oracle, Æg, Pentaho, Quantzig, RTInsights, Sysmech, Tableau Software

Analyse & billede: ZDNet

For big data industri-watchers, den mest indflydelsesrige område til 2017 er ‘AI, machine learning, automation & kognitive systemer’. Analysefirmaet Ovum, for eksempel, tyder på, at “Machine learning er den store stof”, og at “Analytiske applikationer indlejring machine learning er ved at blive normen”. Stigende niveauer af automatisering er næsten uundgåelig, hvis organisationer skal undgå at drukne i data-eller, som Enterra Systemer udtrykker det: “Kunstig intelligens vil vokse i betydning som mængden af data stiger”.

Den anden-placerede tilbagevendende tema for big data eksperter er fremkomsten af ‘Data-drevet business-applikationer’ (også et centralt tema for denne ZDNet særlige rapport). Oracle udtrykker det rammende ved at bemærke, at “Applikationer, ikke blot analytics, drive big data vedtagelse”, mens Gartner forudsiger, at “Data og analytics vil drive moderne virksomhedsdrift, og ikke blot afspejler deres præstation”.

Andre meget citeret tendenser og forudsigelser for 2017 giver anledning til bekymring “Informatik, data, videnskab & data engineering’, ‘Big data spredning & forvaltning” og “Cloud-baserede analyser & data service’.

Hvad undersøgelserne siger

NewVantage Partnere

Management consulting firma NewVantage Partnere (NVP) har været forespørgsler om business og teknologi beslutningstagere i Fortune 1000-virksomheder om deres big data-installationer siden 2012, offentliggøre sin femte rapport i April 2017.

Den overordnede konklusion fra NVP ‘ s Big Data Executive Survey 2017 er, at 80.7% af respondenterne bedømt deres big data investeringer til at blive en succes, med 48.4% rapportering ‘målbare resultater”. Sidstnævnte blev opdelt i ‘største succes’ (forstyrrende/innovative/transformative, 21%) og ‘meget vellykket’ (evolutionær, 27.4%).

Data: NewVantage Partnere / Chart: ZDNet

Boring i de typer af initiativer i gang, toppen af listen i form af resultater er ‘Faldet udgifter gennem operationelle omkostninger effektivitet’, med 72.6 procent af de adspurgte, der starter projekter og 49.2 procent rapportering fordele. Dette giver en succesrate på 67.8%, hvilket er faktisk overgået af ‘Skabe nye veje til innovation og forstyrrelser’ i 68.7% succes (for 64,5% i gang, 44.3% rapportering fordele).

På trods af disse vellykkede projekter, Fortune 1000 virksomhederne i undersøgelsen af NewVantage Partnere, der stadig synes at være kæmper for at etablere en data-drevet kultur: 69.4% har påbegyndt initiativer på dette område, men kun 27.9 procent rapport fordele (40.2% succes).

Blandt de kulturelle hindringer for big data vedtagelse, NVP ‘ s undersøgelse finder, at ‘Utilstrækkelig organisatorisk tilpasning’ position på listen til 42,6 procent, efterfulgt af ‘Manglende mellemledere vedtagelse og forståelse” og “Business modstand eller manglende forståelse’ (41%):

Data: NewVantage Partnere / Chart: ZDNet

Ovenstående figur tyder på, at de vigtigste kulturelle hindringer for big data vedtagelse ligger med business-enheder snarere end IT-afdelingen, som spørgsmål om data, styring, teknologi forståelse og data-strategien er alle nævnt ved betydeligt færre respondenter (<30%).

En vigtig indikator for, at en organisation er en data-drevet kultur, eller er du arbejder hen imod dette mål, er tilstedeværelsen af en Chief Data Officer (CDO). NVP s 2017 undersøgelse viser, at Fortune 1000 virksomheder har gjort fremskridt på denne front i de seneste år:

Data: NewVantage Partnere / Chart: ZDNet

Selv om 60 procent af virksomhederne havde en CDO i 2016, op fra blot 12 procent i 2012, deres nuværende rolle blev set som “defensiv” af et flertal (56%) af NVP er respondenterne — primært reagerer på regulering og compliance-krav. Gå fremad, ledere mener, at Cdo ‘ er bør blive mere ‘offensiv’ — at tage føringen i at drive innovation, opbygning af et data kultur og håndtering af data, som en virksomhed aktiv. Det er formentlig grunden til, at størstedelen (53.4%) mener, at Cdo ‘ erne skal indberette til enten den administrerende DIREKTØR (35.6%) eller COO (17.8%), snarere end CIO (15.6%).

NVP ‘ s undersøgelse også spurgt respondenterne, som forstyrrende faktorer, — bortset fra big data-de forudser, der påvirker deres organisationer over de næste ti år. Ikke overraskende, givet det nuværende niveau af hype omkring emnet, kunstig intelligens og maskinindlæring kom ud på toppen-både i single-og multiple choice-formater:

Data: NewVantage Partnere / Chart: ZDNet

GoDataDriven

For et Europæisk perspektiv, undersøgte vi de Store Data-Undersøgelse fra hollandske data, rådgivning GoDataDriven, som er genereret fra deltagere, der ved Big Data Expo i Holland. Den 2016 survey befolkningen nummereret 315, bestående af 168 ledere og 147 ledere.

Når de bliver spurgt om de vigtigste drivkræfter for succes med big data gennemførelse, frontløber var “En klar vision’, citeret af 71.4 procent af de adspurgte, efterfulgt af ‘Støtte fra forvaltning” (51.2%) og “Støtte til systemer & processer” (40.1%):

Data: GoDataDriven / Chart: ZDNet

Som med NewVantage undersøgelse omtalt ovenfor, er ‘business’ faktorer, der synes at indtage en mere fremtrædende plads end ‘DET” – spørgsmål, når det kommer til big data succes.

Det er ikke til at sige, at DET spørgsmål er ikke vigtige, selvfølgelig. Når de bliver spurgt om de udfordringer, der er i opsætning af big data-infrastruktur, som er de to svar pågældende data kvalitet og data tilgængelighed:

Data: GoDataDriven / Chart: ZDNet

Når data er af tilstrækkelig god kvalitet er til rådighed, og at en data-drevet proces er at blive gennemført, respondenterne angav ‘Big data, viden & data ekspertise’ og ‘Tid til rådighed for eksperimenter” som de største udfordringer:

Data: GoDataDriven / Chart: ZDNet

En bred vifte af forretningsområder, blev behandlet af data-drevne applikationer, der ledes af markedsanalyse, marketing -, web-butikker og online-apps. Kun 2,1 procent af Big Data respondenterne rapporterede, at de havde ingen data-drevne applikationer.

Som NewVantage Partnere, GoDataDriven spurgte sin undersøgelse befolkning om kunstig intelligens. Selv om det kun 14.3 procent var i gang med at gennemføre dybe læring og AI, og 52 procent var enten under udvikling eller er planlagt til at gennemføre dybe læring og AI inden for tre år:

Data: GoDataDriven / Chart: ZDNet

AI er helt sikkert på dagsordenen, men det er klart tidlige dage: lidt over en ud af fem Big Data respondenterne (21.5%) havde ingen planer på dette område.

En ekspert udsigt

For at få et overblik over den aktuelle situation i big data, vi talte Sumit Nijhawan, CEO og præsident på data integritet og data governance løsninger specialist Infogix, hvis Top Ti Transformativ Data Tendenser til 2017 var blandt de kilder til de forudsigelser, som analysen tidligere. Her er nogle af de vigtigste observationer fra interview.

“Næsten hver kunde jeg går til, har en stor data initiativ, og mange projekter starter med en masse momentum, investeringer og ‘buzz’. Men de fremskridt, de har lavet, den værdi de får ud af deres investering, ofte ikke opfylder de oprindelige forventninger,” var Nijhawan ‘ s indledning.

“Nogle ting, vi arbejder videre med vores kunder, som vi tror kan være transformative, er en kombination af data governance, data forberedelse, self-service og mindre data sø-installationer,” tilføjede han.

Så du ville sige, at den største flaskehals i udvinding af indsigter fra big data er faktisk i at opdage de værdifulde data, som virksomheder har, og gøre det tilgængeligt for analyse?

“Ja, de fleste af fokus har været at give de storage-miljø — Hadoop-og lad alle dump, hvad data, kan de i det. To ting mangler her: for det første, hvad er virkelig det endelige mål, og mål for, hvad de er dumping i Hadoop? Og for det andet, selv hvis data er der, det er ikke reguleret, det er ikke søgbare, er det ikke nemmere at finde, og det er der ikke på en måde, der trækker kunder til data og hjælper dem med at få værdi. Det er meget DET, der er afhængige, er der stadig kræver meget tekniske personer at arbejde på det. Det er ikke, hvordan du får værdi ud af disse investeringer.”

Dette betyder, at der er en forbindelse mellem “business”, og DET kan — gøre organisationer, der har brug for at skabe en ‘kultur’, så forretningsenheder vide, hvordan til at stille de rigtige spørgsmål til data og generere indsigter sig selv?

“Vi har helt sikkert brug for mere af en virksomhed drevet data kultur. Det er ikke sådan, at DET fyre ikke ønsker at dele: det er bare, at de har disse værktøjer, og de føler, at de laver et godt stykke arbejde, men at de ikke rigtig ved, hvad det endelige mål er. Det er derfor, medmindre det er en virksomhed drevet initiativ, det er svært for det at materialisere sig i noget meningsfuldt.”

Er der en missing link ” i mange organisationer-en Chief Data Officer (CDO), der kan forbinde C-suite og forretningsenheder at IT-afdelingen?

“Der er absolut et missing link, men jeg ville ikke sige det er bare om én person. Den ‘kultur’ lige nævnes, er, om mennesker, processer og teknologi, sammen med data i sig selv. Det handler virkelig om end-to-end-proces: her er hvordan jeg har tænkt mig at kilde min data; dette er, hvad jeg vil gøre med mine data, og dette er, hvordan jeg har tænkt mig at levere mine data. At end-to-end processen skal være iværksat af en virksomhed sponsor, som helt sikkert kunne være en CDO. Problemet med Chief Data Officer paradigme i dag er, at det næsten er en bureaukratisk position i mange organisationer: CDO angiveligt har indflydelse, men er endt med at blive den person, som leverandører gå til at pitche deres teknologier, snarere end en person, der er der for at opfylde de forretningsmæssige mål.”

Outlook

Der er en masse data om, og der vil være en masse mere i fremtiden, men organisationer, der stadig har masser af arbejde at gøre, hvis de er til rutinemæssigt at vende store data til værdifulde forretningsmæssige indsigt. Oprettelse af en data-drevet kultur og tilgængeligheden af data, forskere og ingeniører (enten rekrutteres eksternt eller uddannet internt) vil være vigtigt i at hjælpe til at gøre dette, i det mindste på kort sigt.

Som astronom og begyndelsen af digitale kriminaltekniske investigator Clifford Stoll, udtrykker det: “Data er ikke information, information er ikke viden, Viden er ikke forståelse, Forståelse er ikke visdom”. Så data forskere og ingeniører, der vil være behov for at udtrække information og viden fra store, heterogene samlinger af data, og data-drevet kultur vil sikre, at de rigtige spørgsmål bliver stillet, så forståelse — og måske endda visdom-til at nå de relevante dele af organisationen.

Ser man længere frem, stigende grad af automatisering-især i området af data forberedelse — og tilgængeligheden af self-service analytics-værktøjer, der vil gøre data-drevet indsigt let tilgængelige for ikke-specialist brugere.

Sammen med data governance regler, såsom EU ‘s GDPR (og hvad version af det post-Brexit BRITISKE regering gennemfører), udviklingen skal bidrage til at udligne magtbalancen i “big data “samfund”, væk fra internet-giganter og i retning af mindre organisationer og enkeltpersoner.

Læs mere om big data

Forskning: Hvordan big data er det, der driver virksomhed indsigt i 2017 (Tech Pro Forskning)Salesforce og IBM løfte sløret for flere data integration toolsMapR automatiserer data prioriteringsordning for hybrid cloudKafka får SQL med KSQLTableau detaljer dens naturlige sprog forespørgsel planer