Med Hortonworks’ DataWorks Topmødet (tidligere Hadoop-Topmødet) starter på tirsdag, virksomheden er på vej ud af porten en dag for tidligt, med dobbelte produkt meddelelser. Specifikt, Hortonworks annoncerer general availability (GA) af v3.0 af Hortonworks DataFlow (HDF), sit produkt til streaming data management. Det er også lancere en ny “Flex Støtte” abonnement for sin Hortonworks Data Platform (HDP) Hadoop distribution, der understøtter kunder, der kører HDP på lokaler, i den offentlige sky, eller en kombination af de to.
Streaming succes
Den HDF 3.0 nyhed er interessant. Produktet er baseret på Apache NiFi, hvilket i sig selv er udstedt sin 0.7.4 udgivelse i sidste uge. Hortonworks erhvervet Onyara, selskabet bag Apache NiFi, tilbage i 2015, snart efter NiFi blev første gang annonceret. Hortonworks gjorde aftale om at komme til streaming-data, spil og udvide sin produktportefølje. I mellemtiden, meget af det momentum bag streaming svæver rundt Apache Storm og Kafka-både som Hortonworks støtter allerede i HDP.
Læs også: Hortonworks introducerer DataFlow, erhverver Apache NiFi-backer Onyara
Læs også: IBM, Cloudera, Amazon meddelelser: Big Data, nyheder roundup
Så det pres, der har været på for HDF at tilføje værdi til eksisterende streaming-platforme, og ikke bare forsøge at standardisere på en ny. HDF kan gøre dette endnu, da det tilføjer to komponenter, Streaming Analytics Manager (SAM) og Skema-Registreringsdatabasen, der begge arbejder på tværs af Storm, Kafka og NiFi. SAM tilføjer en GUI (graphical user interface) miljø for bygning streaming-data-strømme uden kode; det Skema, Registreringsdatabasen tilføjer et katalog over mulige former for data streams, så de bliver synlige i organisationen, og kan genbruges, snarere end fordoblet, når andre hold vil have adgang til de samme data.

Streaming Analytics Manager (SAM) i HDF 3.0
Kredit: Hortonworks
Fri bevægelighed
Tilføjer en GUI over til streaming-data er umagen værd, især hvis det tilføjer et lag af abstraktion oven på flere streaming-motorer. Dette fjerner behovet for kode, der tillader data ingeniører til at fokusere på logik og forretningsmæssige problemer. Det gør også, at logik mere bærbare på tværs af forskellige streaming-teknologier, herunder dem, der ikke er blevet indført endnu. For the record, Hortonworks er ikke den første til at dette spil. StreamAnalytix har været på markedet i flere år, med et lignende produkt, der virker på tværs af Apache Storm, Kafka og Spark Streaming.
Læs også: StreamAnalytix 2.0 tilføjer understøttelse for Gnist
Skemaet Registreringsdatabasen øger muligheden for overførsel, så den logik til at blive brugt af forretningsenheder andre end den, der opretter stream i første omgang. Men da dette er virkelig en facet af data governance, er det rejser spørgsmålet om, hvorvidt sådanne funktioner bør være en del af en bredere styring værktøj, for eksempel Apache Atlas, et projekt, der drives af Hortonworks. Atlas virkelig fokuserer på data slægt og revision, men, snarere end data catalog funktionalitet. Og mens både SAM-og Skema-Registreringsdatabasen er open source-projekter, hverken det ene er en Apache Software Foundation-projektet, i det mindste ikke endnu.
Ambidexterity
Stikning med begrebet portabilitet, Hortonworks ” Flex Støtte idé, bare det giver mening; det er i 2017, og har separate abonnementer for prem og cloud-kunder begynder at lave om så meget mening, som har særskilte aftaler for kunder, der benytter en hardware leverandør frem for en anden. Hvad er nice om Flex Støtte, selv om, er, at det også er bærbare på tværs af kundernes egen Infrastruktur som en Tjeneste (IaaS) offentlige cloud-opsætninger samt dem, der bruger Platform as a Service (PaaS) – implementeringer på Hortonworks Data i Skyen for AWS.
Så, for Hortonworks, det handler om portabilitet, på tværs af streaming-platforme, på tværs af kundens forretningsenheder, og på tværs af on-premises, IaaS og PaaS klynger. I en tid med forandringer, det er, hvad kunderne har brug for. Nu Hortonworks bare har behov for en by-the-job produkt også for kunder, der ikke ønsker at beskæftige sig med diskrete klynger på alle.
Mit gæt er, at det ikke vil være lang.