Syncsort primo Trillium rilascio prende modesto passi verso di dati lago di governance

0
157

Lo scorso anno 112 milioni di dollari Trillium acquisizione ora sotto la sua cintura, Syncsort ha rilasciato il primo l’integrazione con il DMX-h dati Hadoop strumento di integrazione. L’integrazione riunisce Trillium Scoperta di analisi dei dati e Trillium Qualità per la pulizia dei dati. Permetterà agli utenti di profilo e pulizia dei dati come parte del flusso di lavoro per lo spostamento dei dati dal mainframe o altre fonti di Hadoop. Si arriva sulla scia di Marzo con il lancio di Trillium Preciso, basato su cloud di dati-as-a-service per la convalida e per arricchire i record dei clienti.

L’acquisizione, che si è chiuso alla fine dell’anno, ha riempito un vuoto nel Syncsort l’ordinamento dei dati e la migrazione gamma di prodotti aggiungendo qualità di cliente e di verifica dei dati. A partire dalle sue radici nella fornitura di utilities per un ordinamento efficace per sostenere mainframe elaborazione in batch, Syncsort applicato questo approccio per l’elaborazione ETL per altri obiettivi, infine, si estende per Hadoop.

Trillium sfondo è venuto come una business unit di Harte-Hanks, la cui attività ha avuto origine con diretta servizi di posta elettronica. Non sorprendentemente, Trillium sviluppato una competenza di base per l’identificazione e la pulizia nomi e indirizzi dei clienti, non solo in Nord America, ma attraverso una vasta gamma di aree geografiche. Mentre Trillium infine speso i suoi dati in qualità di messa a fuoco al di là del nome e l’indirizzo di pulizia, sotto Harte-Hanks, la società è lento per fare il passaggio dalla data warehousing per i big data.

Prima dell’acquisizione, Trillium avuto una breve collaborazione con Unifi per il cloud-based per la preparazione dei dati di servizio per i Big Data. E anche se di proprietà privata Syncsort è stato estraneo alla acquisizione, per i dati prep la società, per ora, è più probabile che il partner piuttosto che fare o comprare la capacità.

Dato che il Syncsort Trillium acquisizione è inferiore a sei mesi fa, non è sorprendente che il DMX-h/Trillium integrazione è più di un accoppiamento legame tra i due prodotti discreti. DMX-h gli utenti possono inserire i dati di profilazione passi nel flusso di lavoro facendo clic su un pulsante che apre il Trillium utensili. All’interno Trillium, il set di dati può essere analizzato e i record del cliente corrispondente.

Mentre DMX-h era limitata capacità di analisi dei dati (come ad esempio l’identificazione di se una colonna è una data, numerico o stringa di campo), Trillium offre molto di più di granularità nell’identificazione dei tipi di dati. Per esempio, Trillium fornisce conta di modelli, “metaphones” (mondi con pronuncia simile), l’indicizzazione basata su suoni e i record mascherati. È possibile dedurre il tipo di dati, il grado di precisione, min/max range, e scoprire le dipendenze.

Wit questa versione, Syncsort di mira due casi: il più ovvio, sfruttando Trillium dati clienti arricchimento delle capacità, è il Cliente a 360. Questa versione sfiori la superficie; sotto il cofano, Trillium Scoperta ha anche regole di business di funzionalità per l’aggiunta di intelligence per il processo. Ci sono anche opportunità per l’aggiunta di integrazioni con Trillium Preciso.

Syncsort altri target di caso d’uso si trova con i dati lago di governance. Questa versione aggiunge la capacità di condurre analisi dei trend di dati problemi di qualità dei dati per il popolamento dei dati lago. Nel lungo periodo, riteniamo che sarà necessario possedere una preparazione dati capacità di ottenere più gravi con i dati lago di governance.

Sinistra detto è di machine learning e Scintilla di supporto, una capacità che potrebbe avventurarsi al di là delle regole di fornire un approccio più flessibile in materia di qualità dei dati caricati nel data lago. Si tratta di una capacità che probabilmente necessitano di futura acquisizione. Dai dati di puntamento lago di governance, Syncsort si trova contro Informatica e Talend, entrambi i quali hanno un confine suite che comprende anche funzioni come la gestione dei dati master. Ma piantare il suo palo nel terreno a malapena mesi dopo la chiusura dell’acquisizione, Syncsort è chiaro che Trillium è il nucleo dei suoi dati lago di governance tabella di marcia.