Nul

Hortonworks i dag er ved at indføre Dataplane Service (DPS), en ny cloud-baseret tjeneste, for at styre den virtuelle data søer. DPS er, hvad Hortonworks udtryk, en data “stof.” Når vi opdager, at udtrykket en smule upræcist, vil vi karakterisere DPS som en service, der forbinder og gennemfører sikkerheds – og governance-relaterede tjenester, og præsenterer dem til data søen administrator som et katalog af kataloger. DPS vil ikke erstatte tredjeparts-kataloger, der anvendes til data discovery, men arbejde sammen med dem. Det vil sidde i skyen, hvilket giver et sted at “registrere” data kilder, og opbygge et katalog af metadata for håndtering af data-tjenester. Det bygger på eksisterende open source-projekter som Apache Ranger, hvor sikkerhedspolitikker, der er oprettet og anvendes, og Atlas, der håndterer metadata.
Mens DPS vil blive brugt til at kontrollere klynger og håndtering af ledelse og sikkerhed, er det ikke en cluster management, sikkerhed, eller styring af per se. I stedet, det er designet til at tilslutte eksterne tjenester med offentliggjort Api ‘ er. Hortonworks’ mål er at få tredjemand til gin op af sådanne tjenester. Med den udrulning, Hortonworks er herunder en Data Lifecycle Manager, der udfører information lifecycle management (ILM) kapaciteter, der omfatter replikation, disaster recovery, backup og gendan, og automatiseret prioriteringsordning af varmt og koldt data til forskellige klasser af opbevaring. På køreplanen, Hortonworks planer om yderligere tjenester for sikkerhed og installation.
Behovet for DPS stammer fra erkendelsen af, at data søer vil være virtuelle. Med nye mandater, som EU Generel Forordning om databeskyttelse (GDPR) at placere stærke krav om privatlivets fred, i mange tilfælde, vil virksomheder er nødt til at holde forbrugernes data i oprindelseslandet. Oversættelse: hvis du er en multi-national virksomhed, love om privatlivets fred vil kræve du til at opretholde flere fysiske data søer.
Det samme gælder for cloud-strategi. Vi forventer at få store organisationer, der vil sætte alle deres data i skyen, eller i en enkelt sky. Interne politikker eller offentlige bestemmelser, der kan tvinge organisationer ellers opsat på cloud deployment til at opretholde nogle data på stedet. Sand for organisationer der ønsker at flytte til en kritisk masse af deres data og applikationer til skyen, kan vi forvente, at de vil kræve minimum andet kilder. Igen, der vil oversætte til flere data søer.
Så er der det faktum, at Hadoop vil ikke sidde på en ø, men vil eksistere side om side med data warehouses, NoSQL operationelle butikker, IoT-platforme, og streaming-systemer. Der, hvor livet bliver interessant, fordi databaser, der er overlappende. SQL-databaser bliver tilføje JSON kapaciteter og vice versa, og de er i samarbejde med forespørgsel til Hadoop. I mellemtiden, analytiske værktøjer, der har til formål at eje den forespørgsel, uanset hvor det kører. Så er der Informatica og IBMs af verden med deres porteføljer af data integration værktøjer, plus den nyere generation af data forberedelse, katalogisering, og data lake management værktøjer.
DPS er en rettidig tilsætning til Hortonworks portefølje, fordi det anerkender, at organisationer bygning data søer er tilbøjelige til at være styring af flere instanser, og vil kræve en grad af sammenhæng på tværs af dem. DPS ikke erstatte den forvaltningsmæssige værktøjer, der er allerede er en del af Hortonworks platform, herunder Ranger, hvor sikkerhed politikker er fastsat; Knox, der fungerer som en indgang til virksomhedens mapper til godkendelse af brugere; Atlas, for tagging data enheder til styring; og Falcon, som bruges til angivelse af data arbejdsgange.
Djævelen er i detaljerne, fordi cloud-udbydere, database udbydere, data integration værktøjer og analytiske værktøj udbydere som alle ser sig selv i midten af verden i at plante deres indsatser med styring. Og så er der tilfælde af cloud-udbydere der udsigt sikkerhed, identitet og adgangskontrol som bærende søjler af deres service. Hortonworks’ udfordring med DPS vil være, i hvor høj grad kan spille en god nabo til hvert af disse systemer med hensigter for styring.
0