Med förra årets $112 miljoner Trillium förvärv nu under sitt bälte, Syncsort ‘ har släppt den första integration med sin DMX-h Hadoop data integration verktyg. Integration ger tillsammans Trillium Discovery data profilering och Trillium Kvalitet för data rengöring. Det kommer att göra det möjligt för användare att skapa en profil och rena data som en del av arbetsflödet för att flytta data från stordatorer eller andra källor för att Hadoop. Det kommer i hälarna på Mars utbyggnaden av Trillium Exakt ett moln-baserade data-som-en-tjänst för validering och berikande kundregister.
Förvärvet, som avslutades i slutet av året, fyllde en lucka i syncsort ‘ s data sortering och migration sortimentet genom att lägga till kvalitet och kunden kontroll av data. Med utgångspunkt från dess rötter i att tillhandahålla verktyg för effektiv sortering för att stödja stordator batch-bearbetning, Syncsort ‘ tillämpas som metod för att ETL bearbetning till andra mål, så småningom utöka till Hadoop.
Trillium bakgrund kom som en affärsenhet av Harte-Hanks, vars företag har sitt ursprung med direktreklam tjänster. Inte överraskande, Trillium utvecklat en kärnkompetens för att identifiera och rengöring kunders namn och adresser, inte bara på Nordamerika, men inom ett brett spektrum av geografiska områden. Medan Trillium i slutändan förbrukat sina uppgifter kvalitet i fokus bortom namn och adress rensning, under Harte-Hanks, det företag som var för långsam för att göra övergången från data warehousing till big data.
Före förvärvet, Trillium hade ett kortvarigt partnerskap med Unifi för en cloud-baserad data förberedelse tjänster för Big Data. Och även under privat ägande Syncsort ‘ har inte främmande för förvärv, för data prep företaget för nu är mer benägna att samarbeta snarare än att göra eller köpa kapacitet.
Med tanke på att Syncsort ‘ Trillium anskaffandet är mindre än sex månader sedan, är det inte förvånande att DMX-h/Trillium integration är mer löst kopplade koppling mellan två diskreta produkter. DMX-h användare kan infoga data profilering steg i arbetsflödet genom att klicka på en knapp som dyker upp Trillium verktyg. Inom Trillium, är de uppgifter som kan vara profilerade och kundregister matchas.
Medan DMX-h hade begränsade data profilering förmåga innan (såsom att avgöra om en kolumn är ett datum, nummer eller sträng), Trillium ger betydligt större precision identifiera data typer. Till exempel, Trillium erbjuder räknas av mönster, “metaphones” (världar med liknande uttal), indexering baserad på ljud, och maskerade poster. Det kan sluta typ av data, grad av precision, min/max intervall, och upptäcka beroenden.
Vett denna utgåva, Syncsort ‘ är inriktad på två användningsfall: det uppenbart, att utnyttja Trillium s kunduppgifter berikning förmåga, är Kunden 360. Denna release bara skummar på ytan, under huven, Trillium Upptäckt också har business regler kapacitet för att lägga till intelligens till processen. Det finns också möjligheter att lägga till integrationer med Trillium Exakt.
Syncsort ‘ s andra mål använd fall ligger med data sjön styrning. Denna utgåva lägger till förmåga att genomföra trend analys av data kvalitetsfrågor för data fylla i uppgifterna sjön. På lång sikt tror vi att de kommer att behöva en egen data beredning förmåga som de får mer allvarliga med data sjön styrning.
Lämnas osagt är maskininlärning och Gnista stöd, en förmåga som kunde företaget utöver regler för att ge en mer flexibel syn som reglerar kvaliteten på data läses in i data sjön. Detta är en möjlighet som sannolikt skulle kräva framtida förvärv. Genom att rikta data sjön styrning, Syncsort ‘ befinner sig på väg upp mot Informatica och Talend, som båda har gränsen sviter att också omfatta sådana uppgifter som master data management. Men plantera sin stav i marken knappt månader efter slutförandet av förvärvet, Syncsort ‘ är att göra tydligt att Trillium är centrala för att dess uppgifter sjön styrning färdplan.