Mit Hortonworks’ DataWorks Summit (ehemals Hadoop Summit) zum Auftakt am Dienstag, das Unternehmen kommt aus dem Tor, einen Tag zu früh, mit zwei Produkt-Ankündigungen. Speziell, Hortonworks ist mit der Bekanntgabe der Allgemeinen Verfügbarkeit (general availability, GA) von v3.0 von Hortonworks DataFlow (HDF), dessen Produkt für die streaming-Daten-management. Es ist auch die Einführung eines neuen “Flex-Support-Abonnement für Ihre Hortonworks Data Platform (HDP) die Hadoop-distribution, unterstützt Kunden, die mit HDP on-premise, in der public cloud oder einer Kombination von beiden.
Streaming-Erfolg
Die HDF 3.0 news ist interessant. Das Produkt basiert auf Apache NiFi, das selbst hat seine 0.7.4 release Letzte Woche. Hortonworks erworben Onyara, dem Unternehmen hinter Apache NiFi, zurück im Jahr 2015, kurz nach NiFi zum ersten mal angekündigt wurde. Hortonworks hat das Angebot, um in den streaming-Daten-Spiel und erweitert sein Produkt-portfolio. Mittlerweile, ein Großteil der Dynamik, die hinter streaming-bewegt sich um die Apache Storm und Kafka-beide Hortonworks unterstützt bereits in der HDP.
Lesen Sie auch: Hortonworks stellt Datenfluss, erwirbt Apache NiFi-Unterstützer Onyara
Lesen Sie auch: IBM, Cloudera, Amazon Ankündigungen: Big Data-news roundup
So ist der Druck wurde für HDF Mehrwert zu bestehenden streaming-Plattformen, und nicht nur versuchen, die Standardisierung auf eine neue. HDF kann dies tun, aber, wie es fügt zwei Komponenten, Streaming Analytics Manager (SAM) und der Schema Registry, die beide arbeiten über Storm, Kafka und NiFi. SAM fügt eine grafische Benutzeroberfläche (GUI) Umgebung für die Erstellung von streaming-Daten fließt ohne code; Schema Registry fügt einen Katalog der Arten für Datenströme, so dass Sie erkennbar in der Organisation und können wiederverwendet werden, anstatt dupliziert, wenn andere teams wollen auf die gleichen Daten zugreifen.

Streaming Analytics Manager (SAM) in HDF 3.0
Credit: Hortonworks
Bewegungsfreiheit
Hinzufügen eines GUI über streaming-Daten lohnt sich, vor allem, wenn es fügt eine Ebene der Abstraktion über mehrere streaming-Motoren. Dies beseitigt die Notwendigkeit für den code, so dass die Daten-Ingenieure den Fokus auf Logik und business-Probleme. Es macht auch, dass die Logik mehr portabel auf verschiedenen streaming-Technologien, einschließlich diejenigen, die noch nicht vorgestellt wurden. Für das Protokoll, Hortonworks ist nicht das erste zu diesem Spiel. StreamAnalytix wurde im Markt bereits seit einigen Jahren mit einem ähnlichen Produkt, funktioniert auf Apache Storm, Kafka und Spark-Streaming.
Lesen Sie auch: StreamAnalytix 2.0 fügt Unterstützung für Spark
Die Schema-Registrierung erhöht die Portabilität, so dass die Logik, die verwendet von den business units, andere als die, die den stream in den ersten Platz. Aber da das wirklich ist, eine Facette des data governance stellt sich die Frage, ob eine solche Funktionalität sollte Teil einer breiter angelegten governance-tool, zum Beispiel Apache Atlas, ein Projekt, angetrieben von Hortonworks. Atlas wirklich konzentriert sich auf die Herkunft von Daten und Prüfung, aber, anstatt Daten Katalog-Funktionalität. Und während die beiden SAM und Schema-Registry sind open-source-Projekten, weder das eine ist ein Apache-Software-Foundation-Projekt, zumindest noch nicht.
Beidhändigkeit
Kleben mit dem Konzept der übertragbarkeit, die Hortonworks’ Flex-Support-Idee macht Sinn; es ist 2017, und mit separaten Abonnements für on-prem und cloud-Kunden ab, machen etwa so viel Sinn wie mit verschiedene Verträge für Kunden, die mit einem hardware-Hersteller über ein anderes. Was ist schön über Flex-Unterstützung, obwohl, ist, dass es auch portabel auf Kunden eigenen Infrastruktur als Service (IaaS) in der public cloud-setups sowie diejenigen, die sich mit Platform-as-a-Service (PaaS) – Implementierungen auf der Hortonworks-Data-Cloud von AWS.
So, für Hortonworks, es ist alles über die Portabilität, über streaming-Plattformen, über customer business units und über on-premises -, IaaS-und PaaS-Cluster. In einer Zeit des übergangs, das ist es, was Kunden brauchen. Jetzt Hortonworks braucht nur ein durch-den-job-Produkt auch für Kunden, die nicht wollen, befassen sich mit diskreten Clustern auf alle.
Meine Vermutung ist, es wird nicht lange dauern.