Syncsort die erste Trillium-release dauert bescheidene Schritte in Richtung data-governance-See

0
172

Mit der letztjährigen $112 Millionen Trillium übernahme jetzt unter seinem Gürtel, Syncsort hat, veröffentlicht die erste integration mit dem DMX-h Hadoop-data-integration-tool. Die integration bringt Trillium Discovery-Daten-profiling-und Trillium-Qualität für die Datenbereinigung. Sie ermöglicht es, Benutzer-profile und-cleanse-Daten als Teil des Workflows zum verschieben von Daten aus Großrechner oder anderen Quellen in Hadoop. Es kommt auf den Fersen des Marsches rollout von Trillium Präzise, eine cloud-basierte Daten-as-a-service für die Validierung und Anreicherung von Kundendaten.

Die übernahme geschlossen am Ende des Jahres, füllte eine Lücke in Syncsort Daten Sortieren und migration Produkt-lineup durch hinzufügen von Qualität und Kunden-Daten-Verifizierung. Ausgehend von seinen Wurzeln in der Bereitstellung von Funktionen für die effiziente Sortierung zur Unterstützung der mainframe-batch-Verarbeitung, Syncsort angewendet, dass der Ansatz der ETL-Verarbeitung auf andere Ziele, schließlich hin zu Hadoop.

Trillium hintergrund kam ein Geschäftsbereich von Harte-Hanks, dessen Geschäft entstand mit direct mail services. Nicht überraschend, Trillium entwickelt eine Kern-Kompetenz für die Ermittlung und Bereinigung von Kunden-Namen und Adressen, nicht nur in Nordamerika, sondern über eine Breite Palette von geografischen Regionen. Während Trillium letztlich aufgewendet seinen data-quality-Fokus über den Namen und die Adresse der Reinigung, unter die Harte-Hanks, das Unternehmen war langsam, um den übergang von data warehousing, big data.

Vor der übernahme, Trillium hatte eine kurzlebige Partnerschaft mit Unifi für eine cloud-basierte Aufbereitung der Daten-service für Big Data. Und obwohl unter den privaten Besitz Syncsort wurde kein fremder zum Erwerb, zur Daten-Vorbereitung des Unternehmens für jetzt ist eher der partner eher als make-or-buy die Fähigkeit.

Da die Syncsort Trillium Erwerb von weniger als sechs Monaten, ist es nicht verwunderlich, dass die DMX-h/Trillium integration ist mehr eine lose Verbindung zwischen zwei diskreten Produkten. DMX-h können die Benutzer einfügen von Daten-profiling-Schritte in den workflow, indem Sie auf eine Schaltfläche, öffnet sich der Trillium-Werkzeugen. Innerhalb Trillium, die Daten legen Sie ein Profil erstellt werden kann-und Kunden-Datensätze verglichen.

Während sich DMX-h beschränkt hatte, Daten-profiling-Möglichkeiten vor (wie die Ermittlung, ob eine Spalte ist ein Datum, numerische oder string-Feld), Trillium bietet weit mehr Granularität bei der Identifizierung von Daten-Typen. Zum Beispiel, Trillium liefert Grafen von mustern, “metaphones” (Welten mit ähnlichen Aussprache), die Indizierung basiert auf sounds und maskierten Datensätze. Sie können ableiten, Datentyp, Genauigkeit, min – /max-Bereiche und Abhängigkeiten ermitteln.

Wit release, Syncsort, zielt auf zwei Anwendungsfälle: die offensichtliche, die Nutzung Trillium Kunden-Anreicherung der Daten-Funktionen ist der Kunde 360. Dieses release nur gleitet der Oberfläche; unter der Haube, Trillium Discovery verfügt auch über business-rules-Funktionen für das hinzufügen von Intelligenz in den Prozess. Es gibt auch Möglichkeiten zum hinzufügen von Integrationen mit Trillium Präzise.

Syncsort ‘ s andere Ziel-use-case liegt mit data-lake-governance. Diese Version fügt Funktionen durchführen-trend-Analyse von Problemen mit der Datenqualität für Daten Auffüllen der Daten See. In der lange run, wir glauben, dass Sie benötigen, um eine Daten-Vorbereitung-Funktion, wie Sie bekommen mehr schwere mit data-lake-governance.

Links ungesagt ist maschinelles lernen und Spark-Unterstützung, eine Funktion, die könnte venture jenseits der Regeln bieten einen flexiblen Ansatz zur Regelung der Qualität der geladenen Daten in das data See. Dies ist eine Fähigkeit, die würde wahrscheinlich eine spätere übernahme. Durch die targeting-data-lake-governance, Syncsort findet sich schon von selbst kommen gegen Informatica und Talend, die beide über eine Grenze Suiten umfassen auch Funktionen wie master-data-management. Aber das Einpflanzen seinen Pfahl in den Boden ein kaum Monate nach Abschluss der Akquisition, Syncsort ist klar, dass die Trillium ist Kern der Daten-See-governance-Fahrplan.