Hortonworks spiller balancegang i skyen

0
157

Nul

dataworks-summit-san-jose-2017-keynote.png

På nogle måder Hortonworks er gammeldags i, at det stadig klamrer sig til den strækning mål for styring af halvdelen af verdens data i en tid, hvor cloud-objekt, butikker og skræddersyede analytiske tjenester er ved at tilføje flere alternativer til mix. Hortonworks’ forhåbning mål kan ikke være realistisk, men pyt, der er større fisk at stege.

Det underliggende budskab fra dette års North American DataWorks Topmødet og analytiker briefinger, er, at virksomheden er konkurrerende og udfordringer at navigere i en multipolar cloud verden.

Min store på data bro Andrew Brust rapporterede de overskrifter, der kommer ud tidligere på ugen: Hortonworks er at frigive version 3,0 af sine data, platform, der, til forveksling, er baseret på Hadoop 3.1. Som vi rapporterede tilbage i starten af året, den 3.x generation af Apache Hadoop vil markere et vendepunkt med containerization og opbevaring. HDP 3,0 tilføjer GARN støtte til at køre Docker containere, hvilket betyder at du kan køre containertransport job, med alle afhængigheder og konfigurationer, der rullede ind. Det understøtter også slettet kodning, hvilket giver en sti til prioriteringsordning data, og begynder at abstrahere støtte for specialiseret hardware såsom Gpu ‘ er.

Virksomheden er stabiliserende økonomisk. Der kommer oven på en 4. Kvartal, at slå gaden, den seneste Q1 kvartal, der sluttede i Maj viste et positivt cash flow. I modsætning til Cloudera, Hortonworks har trukket sig væk fra denne liste så langt uden at skære i R&D. Men blandt alle leverandører, hvis lad er baseret på Hadoop, der er en fælles tråd af battening ned luger, især når det kommer til kundernes køb – bare at Hortonworks er mindre udtalt om det.

Efter sidste års offentliggørelse af en markant optrappet forhold til IBM udvidelse til fælles gå til marked og produkt, og det åbne spørgsmål var, om dette år ville vise progression mod ægteskab. Efter et år, der var en mærkbar indvirkning på ny HDP kunder blandt IBM base, men i grand ordningen af ting, der endnu ikke er en meget imponerende. Den langsomme rampe-op af forholdet taler til udfordringen i at dreje en enorm organisation som IBM om en skilling, og at den virkelighed, at de Hortonworks kundebase stadig værdier uafhængighed. Men der var en ny udvikling i IBM forhold: det er at åbne en ny IBM Vært Analytics med Hortonworks (IHAH) cloud-tjeneste, der vil også bundle IBM Db2 Stor SQL, og IBM Data Videnskab Oplevelse. Af den måde, vi er ikke kommet op med den forkortelse.

Selv med Hortonworks og IBM forsøger at BFFs, Microsoft er næppe folde sine kort. Dette er den virksomhed, hvor Azure HDInsight, forudsat Hortonworks sin første store OEM-kanal. Hortonworks og Microsoft igen forøgede Azure forhold, og udvide det til IaaS side, hvor der er nye fælles udvikling og støtte til at optimere HDP på kernen Azure infrastruktur. På den horisont, vi forventer udvidet støtte Azure Data Søen Opbevaring (ADLS), en mere optimeret form af cloud-lagring, der matcher en strategi, der Cloudera har allerede underskrevet på.

Lad os ikke glemme, Google Cloud. Hortonworks har taget det første store skridt til at optimere til GCP-platform med understøttelse af Google Cloud Storage. Der sætter Google på niveau med, hvad Hortonworks allerede gør med AWS og Azure.

Men med den byge af cloud-meddelelser kommer en mere moderat holdning, der kommer fra Hortonworks kundebase. Mens selskabet ikke kan bryde ud af cloud indtægter, det anslår, at omkring 20% af sin base har mindst én HDP gennemførelse i skyen. I betragtning af, at Hadoop spillere som Hortonworks er at fordoble ned på ekspanderende forretning med eksisterende kunder, at de relativt bevidst tempo af cloud adoption er forståeligt, da dette vil i høj grad medføre en overflytning af eksisterende arbejdsopgaver fra early adopters, der sandsynligvis allerede har de nødvendige kompetencer til at håndtere deres klynger. Ja, som flere arbejdsbyrder inddrage data, der bor i sky, vil du se en højere procentdel af den installerede base gennemføre der. Men husk, at med sweet spot af Hortonworks installeret base der tidligt Hadoop adoptanter, dette er ikke den primære kohorte krævende cloud forenkling.

Og med sky, Hortonworks og andre udbydere af Hadoop-platforme er ikke længere det eneste spil i byen for big data analytics. Der er masser af a la carte-tjenester for at køre R eller python-projekter, for ikke at nævne machine learning og dybe læring arbejdspres, og med cloud storage er ved at blive de facto-data søen, behøver du ikke nødvendigvis har brug for Hadoop til at køre dem. Den forskel, at Hadoop tilbyder, er styring, men der er også domænet for data warehouse etablerede, der er også eyeing kører mere forskelligartet analytics arbejdsmængder.

Det sætter scenen for den frenemy relationer af alle etablerede udbydere med AWSs, Azures, og GCPs af verden. Mærkeligt som det ser ud til at forestille sig, Hortonworks, eller Cloudera og MapR for den sags skyld, som er grupperet som en del af on-premise “legacy” de står over for den udfordring at imødegå opfattelsen af, at cloud-udbyderen native platforme som EMR, Cloud Dataproc, eller punkt-tjenester er ved at blive den nye big data standard i skyen.

For Hortonworks, det er, hvor Dataplane Tjenester (DPS) kommer ind i billedet. Som vi rapporterede i sidste efterår, DPS er faktisk et katalog af kataloger for at registrere og katalogisere data services. For at gøre DPS mere anvendelige, Hortonworks er begyndt at rulle ud af en serie af opgave – eller rolle-orienterede plugins, begyndende med Data Analytics-Studie, der lader dig udforske Hive metadata og Data Steward Studie, som netop er blevet udgivet i uddrag for at opdage, hvilken klynger få adgang til NameNode og check for outliers, såsom personlige OPLYSNINGER med data, der ikke er korrekt mærket eller er maskeret. Men det er kun begyndelsen – vi forventer, at DPS vil spille en stigende rolle i at gøre HDP mere cloud-agnostisk.

Med den tone af konferencens keynote-taler flytte fra støj om Apache zoo dyr til at ud-tager fra en data warehousing konference (fremhæve temaer, ligesom betydningen af kvaliteten af data), Hortonworks stræber efter en besked af virksomhedens normale forhold. Hadoop bør ikke være så mærkeligt outlier-platform, der sidder i hjørnet. Hold dine øjne på projekter som Apache Ozon, der endelig efter års drægtighed, begynde at gøre Hadoop til at ligne en almindelig borger, ikke kun i cloud, men også i virksomhedens datacenter.

Relaterede Emner:

Cloud

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software

0