NORSK

Het draaien van big data in het bedrijfsleven inzichten: De stand van zaken

175

Nul

We leven in een steeds meer data-driven society, waarin informatie wordt steeds zo veel van een munt als geld. Veel consumenten gebruik maken van de gratis diensten van internet giganten zoals Google, Facebook, Amazon, Microsoft en Apple, bijvoorbeeld, en in ruil laat deze bedrijven op te sporen en monetise hun online gedrag.

Een van de belangrijkste vragen van de dag is de openheid van dergelijke transacties en de mate van controle die mensen hebben over het lot van de persoonlijke informatie die ze-soms onbewust — verstrekken aan organisaties waarmee ze communiceren online. Recente stemmen aan beide zijden van de Atlantische oceaan hebben gewezen op de capaciteit voor data-savvy organisaties naar de hoover-up en het profiel van grote hoeveelheden gegevens van de gebruiker-met inbegrip van de demografie, het gedrag van de consument en internet activiteit — om micro-target advertenties, nieuwsberichten en diensten ter ondersteuning van bepaalde doelen of goede doelen.

Het is duidelijk dat de gegevens sluizen worden nu open voor bedrijven van alle maten en beschrijvingen, waardoor talloze mogelijkheden voor een tijdige analyse in de uitoefening van een competitief voordeel. Hoewel de focus ligt momenteel schuin in de richting van het gedrag van de klant, is de data beschikbaar op meerdere punten in het product of de service supply chain, en komt in vele vormen — traditionele (gestructureerde), ad-hoc (ongestructureerde), real-time, en de IoT – of M2M-gegenereerd, om maar een paar te noemen.

Bedrijven die het implementeren van big data analytics succesvol te kunnen profiteren van de rijke beloningen van kostenbesparingen en opbrengsten van innovaties. Dit kan bedrijven helpen bij het bereiken van een digitale transformatie, waardoor ze onderhouden van het concurrentievermogen van de verstorende startups — die data-driven bijna per definitie-dat de lente in hun markten.

Echter, handige, zakelijke inzichten niet automatisch voortvloeien uit een torrent van heterogene informatie: bruikbare gegevens moeten worden geïdentificeerd, georganiseerd en geanalyseerd, en de resultaten zijn geïmplementeerd in de relevante onderdelen van het bedrijf. Dat vereist planning, het budget en de juiste tools en expertise.

Dit overzicht en de rest van deze ZDNet bijzonder verslag, bespreekt de stand van zaken in big data analytics. We zijn geslaagd voor ‘piek hype’ over het onderwerp — stelde analist Gartner liet Big Data van haar Hype Cycle for Emerging Technologies terug in 2015 — maar heeft het nog niet opgeleverd aan haar belofte?

Hoeveel gegevens?

Pogingen worden regelmatig gemaakt om in te schatten hoe veel gegevens gegenereerd worden wereldwijd elk jaar, en in welke vorm. Terug in 2014, IDC en EMC de ‘Digital Universe’ op 4.4 zettabytes (ZB) in 2013 — 4.4 biljoen gigabytes — en voorspelde dat dit zou uitgroeien tot 44ZB in 2020, meer dan verdubbelt elke twee jaar. De meest recente schatting van IDC en Seagate is de Leeftijd van Gegevens 2025 rapport, plaatst de 2025 figuur (nu genoemd de ‘Global Datasphere’) op 163ZB — een tienvoudige stijging van de 16.1 ZB gemaakt in 2016.

Afbeelding: IDC/Seagate

De IDC/Seagate rapport voorspelt ook dat het grootste deel van de wereldwijde data creatie zal verschuiven van consumenten aan bedrijven, de laatste goed voor 60 procent in 2025. Trends in het besturen van deze verschuiving, volgens het rapport, zijn: de evolutie van de gegevens van zakelijke achtergrond te leven-kritisch; embedded systemen en de IoT; cognitieve/AI systeem dat de verandering van het landschap; mobiel en real-time data en de veiligheid als een kritische stichting.

Al die gegevens heeft behoefte aan een thuis, een permanent of tijdelijk, dat verklaart het belang van een opslag bedrijf als Seagate in dit gebied.

In een verklaring de lancering van het rapport, Seagate CEO Steve Luczo (binnenkort Uitvoerend Voorzitter) zei: “Terwijl wij kunnen uit dit nieuwe onderzoek dat het tijdperk van Big Data is bij ons, de waarde van de gegevens is niet echt in de ‘bekende’, maar in de ‘onbekende’ waar zijn we sterk onderschatting van de mogelijkheden van vandaag. Wat is echt spannend zijn de analyses, de nieuwe bedrijven, het nieuwe denken en nieuwe ecosystemen van industrieën, zoals robotica en machine-to-machine learning, en hun diepgaande sociale en economische impact op onze samenleving. De mogelijkheid voor bedrijven vandaag de dag en morgen ondernemers voor het vastleggen van de waarde van de gegevens is enorm, en onze wereldwijde business leiders zal het verkennen van deze mogelijkheden voor de komende decennia.”

Welke gegevens?

Geconfronteerd met een verbijsterende hoeveelheden data, CxOs kan worden vergeven voor het gevoel overweldigd. Maar, natuurlijk, niet alle gegevens geschikt of beschikbaar is voor analyse. In de Leeftijd van Gegevens 2025 rapport, bijvoorbeeld, IDC schat dat in 2025 zo ‘ n 20 procent van de gegevens in de wereldwijde datasphere zijn essentieel voor ons dagelijks leven, en 10 procent van die ‘hyperkritische’:

Afbeelding: IDC/Seagate

Het rapport constateert: “de opkomst van De hyperkritische gegevens moet dwingen bedrijven bij het ontwikkelen en implementeren van het vastleggen van gegevens, analyses, en de infrastructuur die zorgt voor een zeer hoge betrouwbaarheid, bandbreedte en beschikbaarheid; meer beveiligde systemen; nieuwe zakelijke praktijken; en zelfs nieuwe juridische infrastructuur te beperken blootstelling aan het verschuiven en potentieel invaliderende verplichtingen.”

AI en machine learning zal in toenemende mate worden betrokken bij big data-analyse, die verder beperkt de hoeveelheid beschikbare gegevens. In de Leeftijd van Gegevens 2025 rapport van IDC schat dat tegen het einde van 2025 slechts 15 procent van de gegevens in de wereldwijde datasphere zal worden gelabeld — en dus geschikt voor AI/ML-analyse — en slechts 20 procent (3% van het totaal) daadwerkelijk zal worden geanalyseerd door cognitieve systemen:

Afbeelding: IDC/Seagate

Big Data trends & voorspellingen

Aan het begin van elk jaar, experts in een verscheidenheid van tech gebieden bieden hun samenvattingen van de huidige trends en voorspellingen voor de komende 12 maanden. Big data is geen uitzondering, en we hebben gesorteerd meerdere 2017 bijdragen, het toewijzen van voorspellingen tot een reeks van opkomende categorieën. Hier ziet u hoe een voorbeeld van de expert gemeenschap bekeken de big data-landschap 2017 is gestart:

Voorspellingen van: Acodez, Big Data Eenvoudig Gemaakt, Datafloq, Datameer, Enterra Oplossingen, Gartner, HP Enterprise, IBM, Infogix, MapR, Oracle, Ovum, Pentaho, Quantzig, RTInsights, Sysmech, Tableau Software

Analyse & beeld: ZDNet

Voor big data-industrie-watchers, de meest invloedrijke gebied voor 2017 is ‘AI, machine learning, automatisering & cognitive systems’. Analysebedrijf Ovum, bijvoorbeeld, suggereert dat “Machine learning is de grote disruptor” en dat “Analytic applications verankering van’ machine learning ‘worden de norm”. Het verhogen van het niveau van automatisering zijn bijna onvermijdelijke voorwaarde om organisaties te voorkomen verdrinking in gegevens-of, zoals Enterra Systemen formuleert: ‘Kunstmatige intelligentie zullen groeien in belang als data volume toeneemt”.

De als tweede geplaatste terugkerend thema voor big data-deskundigen is de opkomst van ‘Data-driven business applications’ (ook een belangrijk thema voor deze ZDNet speciale rapport). Oracle stelt het kort en bondig door op te merken dat “Applicaties, niet alleen google analytics, het voortbewegen van big data adoptie”, terwijl Gartner voorspelt dat “Data en analytics rijden moderne bedrijfsvoering, en niet gewoon een afspiegeling van hun prestaties”.

Andere veel geciteerde trends en voorspellingen voor 2017 zorg ‘Informatica data science & data engineering’, ‘Big data verspreiding & governance’ en ‘Cloud-based analytics & geïntegreerde data services’.

Wat de onderzoeken zeggen

NewVantage Partners

Management consulting firma NewVantage Partners (NVP) is het opvragen van de business-en it-besluitvormers in de Fortune 1000-bedrijven over hun big data-implementaties sinds 2012, de publicatie van het vijfde rapport in April 2017.

De kop van het vinden van de NVP is Big Data Executive Survey 2017 is dat 80.7% van de respondenten beoordeeld op hun grote investeringen in data om succesvol te zijn, met met 48,4 procent rapportage ‘meetbare resultaten’. De laatste werden onderverdeeld in ‘hoogste succes’ (disruptive/innovatieve/vernieuwende, 21%) en ‘zeer succesvol’ (evolutionair, 27.4%).

Gegevens: NewVantage Partners / Grafiek: ZDNet

Een analyse op lager niveau in de soorten van initiatieven aan de gang, de top van de lijst in termen van resultaten is de ‘Afname van de kosten door middel van operationele kostenefficiënties’, met 72.6 procent van de respondenten het starten van projecten en 49.2 procent rapportage voordelen. Dit geeft een slagingspercentage van 67.8 procent, dat is eigenlijk verbeterd door ‘het Creëren van nieuwe mogelijkheden voor innovatie en verstoring’ op 68.7 procent succes (64.5% gestart, 44.3% rapportage voordelen).

Ondanks deze succesvolle projecten, de Fortune 1000-bedrijven onderzocht door NewVantage Partners nog steeds lijken te worstelen om een data-gedreven cultuur: in totaal 69,4 procent zijn begonnen met initiatieven op dit gebied, maar slechts 27,9 procent rapport voordelen (40.2% succes).

Onder de culturele belemmeringen voor big data adoptie, NVP onderzoek vindt ‘Onvoldoende organisatorische afstemming’ kop van de lijst 42.6 procent, net voor het Gemis van het midden-management vaststelling van en inzicht’ en ‘Business weerstand of gebrek aan inzicht’ (41%):

Gegevens: NewVantage Partners / Grafiek: ZDNet

De bovenstaande tabel blijkt dat de belangrijkste culturele belemmeringen voor big data aanneming liggen met business units in plaats van de IT-afdeling, voor de aangelegenheden betreffende data governance, technologie begrijpen en data-strategie worden alle genoemd door veel minder respondenten (<30%).

Een belangrijke indicator die een organisatie heeft een data-gedreven cultuur, of is het werken naar dat doel, is de aanwezigheid van een Chief Data Officer (CDO). De NVP is 2017 enquête blijkt dat van de Fortune 1000 bedrijven zijn het maken van vooruitgang op dit vlak in de afgelopen jaren:

Gegevens: NewVantage Partners / Grafiek: ZDNet

Hoewel 60 procent van de bedrijven had een CDO in 2016 slechts 12 procent in 2012 hun huidige rol werd gezien als ‘defensief’ door een meerderheid (56%) van de NVP de respondenten — vooral reageren op de regelgeving en compliance-eisen. Vooruit gaan, de kaderleden die Cdo ‘ s moet steeds meer ‘offensieve’ — het voortouw nemen in het stimuleren van innovatie, het bouwen van een data-cultuur en het beheer van gegevens als een enterprise asset. Dat is vermoedelijk de reden waarom de meerderheid (53.4%) zijn van mening dat Cdo ‘ s moeten rapporteren aan de CEO (35.6%) of de COO (17.8%), in plaats van de CIO (15.6%).

De NVP is de enquête ook gevraagd of de respondenten die storende factoren — afgezien van big data — verwachten zij van invloed zijn hun organisaties de komende tien jaar. Niet verrassend, gezien het huidige niveau van de hype rond het onderwerp, kunstmatige intelligentie en machine learning kwam uit op de top-zowel in single en multiple choice formaten:

Gegevens: NewVantage Partners / Grafiek: ZDNet

GoDataDriven

Voor een Europees perspectief, kijken we naar het Big Data Onderzoek van het nederlandse gegevens consultancy GoDataDriven, die is gegenereerd op basis van de deelnemers aan het Big Data-Expo in Nederland. In 2016 onderzoekspopulatie genummerde 315, bestaande uit 168 leidinggevenden en 147 managers.

Wanneer wordt gevraagd naar de belangrijkste factoren van een succesvolle big data-uitvoering, de koploper was ‘Een duidelijke visie’, geciteerd door 71.4% van de respondenten, gevolgd door ‘Ondersteuning van het management’ (51.2%) en ‘Ondersteunende systemen en processen’ (40.1%):

Gegevens: GoDataDriven / Grafiek: ZDNet

Als met de NewVantage onderzoek dat hierboven is besproken, ‘business’ factoren lijken te prominenter dan ‘HET’ thema ‘ s als het gaat om big data succes.

Dat is niet om te zeggen dat HET thema niet belangrijk, natuurlijk. Wanneer gevraagd over de uitdagingen bij het opzetten van big data-infrastructuur, de bovenste twee reacties betreffende de kwaliteit van gegevens en de beschikbaarheid van de gegevens:

Gegevens: GoDataDriven / Grafiek: ZDNet

Zodra de gegevens van voldoende kwaliteit beschikbaar is en een data-gedreven proces moet worden uitgevoerd, de respondenten op ‘Big data kennis & data science expertise’ en ‘Tijd beschikbaar is voor het experiment’ als de grootste uitdagingen:

Gegevens: GoDataDriven / Grafiek: ZDNet

Een breed scala van zakelijke gebieden werden toegesproken door data-driven applicaties, onder leiding van marktanalyse, marketing, webshops en online apps. Slechts 2,1 procent van Big Data Survey respondenten gaf aan dat ze nog geen data-driven applicaties.

Als NewVantage Partners, GoDataDriven gevraagd de enquête bevolking over kunstmatige intelligentie. Hoewel slechts 14,3 procent waren bezig met de uitvoering van diep leren en AI, 52 procent, hetzij in ontwikkeling of van plan is te implementeren diep leren en AI binnen de drie jaar:

Gegevens: GoDataDriven / Grafiek: ZDNet

AI is zeker op de agenda, maar het is duidelijk vroege dagen: iets meer dan één op de vijf Big Data respondenten (21.5%) had geen plannen op dit gebied.

Een expert view

Om een overzicht te krijgen van de stand van zaken in big data, spraken we Sumit Nijhawan, CEO en voorzitter van de integriteit van gegevens en data governance solutions specialist Infogix, waarvan de Top Tien Transformerende Gegevens Trends voor 2017 was een van de bronnen voor de voorspellingen analyse, eerder voorgesteld. Hier zijn een aantal belangrijke observaties uit het interview.

“Bijna iedere klant ga ik naar een big data-initiatief, en veel projecten beginnen met een flink de vaart in, de investeringen en de ‘buzz’. Maar de vooruitgang die ze hebben gemaakt, de waarde die ze krijgen van hun investeringen, vaak niet voldoen aan de oorspronkelijke verwachtingen,” was Nijhawan openingswoord.

“Sommige dingen die we doen met onze klanten, waarvan we denken dat het kan worden transformerende, zijn een combinatie van data governance, data preparatie, self-service en kleiner gegevens meer implementaties,” voegde hij eraan toe.

Dus je zou zeggen dat het belangrijkste knelpunt bij het uitpakken van inzichten uit big data is eigenlijk in het ontdekken van de waardevolle data die bedrijven hebben, en maakt deze beschikbaar voor analyse?

“Ja, de meeste van de focus is om de storage-omgeving — Hadoop — en laat iedereen dump welke gegevens in. Twee dingen ontbreken hier: ten eerste, wat is nu werkelijk het einde doel en het doel van wat ze dumpen in Hadoop? En ten tweede, zelfs als de data is er, het is niet geregeld, het is niet doorzoekbaar is, het is niet vindbaar, en het is er niet in een manier dat trekt consumenten aan de gegevens en helpt hen te krijgen waarde. Het is erg IT-afhankelijk, nog steeds vereist zeer technische mensen werken. Dat is niet hoe krijgt u de waarde van deze investeringen.”

Betekent dit dat er een kloof tussen ‘de business’ en IT-organisaties behoefte aan het stimuleren van een ‘data-cultuur’, zodat de business units te weten hoe je de juiste vragen van de gegevens en het genereren van inzichten zelf?

“We moeten er dus zeker meer van een business-driven data cultuur. Het is niet zo dat de jongens HET niet wilt delen: het is gewoon dat ze deze tools en ze het gevoel dat ze het goed doet, maar ze weten niet echt wat het einddoel is. Dat is de reden waarom, tenzij het een business-gedreven initiatief, het is moeilijk voor te materialiseren in iets betekenisvol.”

Is er een missing link in veel organisaties — een Chief Data Officer (CDO), die verbinding kunnen maken van de C-suite en business units van de ict-afdeling?

“Er is absoluut een missing link, maar ik zou niet zeggen dat het slechts over één persoon. De gegevens van cultuur’ net gezegd is over mensen, processen en technologieën, samen met de gegevens zelf. Het is echt over de end-to-end proces: hier is hoe ga ik de bron van mijn gegevens; dit is wat ik ga doen met mijn gegevens; en dit is hoe ik ben gaan leveren met mijn gegevens. Dat de end-to-end proces moet worden gestart door een zakelijke sponsor, die zeker de CDO. Het probleem met de Chief Data Officer paradigma, het is vandaag, het is bijna een bureaucratische positie in veel organisaties: het CDO-zogenaamd heeft invloed, maar heeft uiteindelijk de persoon die leveranciers gaan om te pitchen hun technologieën, in plaats van iemand die er is om te voldoen aan de bedrijfsdoelstellingen.”

Outlook

Er staan veel gegevens over, en er zal veel meer in de toekomst, maar organisaties hebben nog steeds veel werk te doen als ze zijn om routinematig zet big data naar waardevolle inzichten. De oprichting van een data-gedreven cultuur en de beschikbaarheid van gegevens wetenschappers en ingenieurs (aangetrokken extern of intern opgeleid) zal belangrijk zijn in het helpen om dit te bereiken, tenminste op de korte termijn.

Als astronoom en het begin van digitaal forensisch onderzoeker Clifford Stoll: “Data is geen informatie, Informatie is geen kennis, Kennis is niet te begrijpen, Begrijpen is het niet de wijsheid”. Dus de gegevens wetenschappers en ingenieurs zijn nodig om informatie te halen en kennis van grote, heterogene verzamelingen van gegevens, en een data-gedreven cultuur zal ervoor zorgen dat de juiste vragen worden gesteld, waardoor het begrijpen — en misschien zelfs wijsheid, om het bereiken van de relevante onderdelen van de organisatie.

Verder vooruitblikkend, het verhogen van het niveau van automatisering, vooral op het gebied van data voorbereiding — en de beschikbaarheid van self-service analytics tools data-gedreven inzichten gemakkelijk beschikbaar zijn voor de niet-gespecialiseerde gebruikers.

Samen met data governance regelgeving van de EU GDPR (en welke versie van de post-Brexit BRITSE regering implementeert), deze ontwikkelingen moeten helpen om het evenwicht van de macht in de ‘big data ‘ de samenleving’, weg van internet reuzen en in de richting van kleinere organisaties en individuen.

Lees meer over big data

Onderzoek: Hoe big data is het rijden van zakelijke inzichten in 2017 (Tech Pro Onderzoek)Salesforce en IBM onthult meer data-integratie toolsMapR automatiseert gegevenslagen voor de hybride cloudKafka krijgt SQL met KSQLTableau details van de natuurlijke taal query plans