MapR automatiserer data prioriteringsordning for hybrid cloud

0
186

0

mapr-logo-wide3.png

Mens cloud lover mere operationelle enkelhed for gennemførelse af big data-projekter, er det ikke ensbetydende med, at virksomheder kan omgå omkostninger og problemer med ledelsen, de står over for onboarding af nye applikationer og data sæt. Mens Ægget forventer, at cloud vil tage højde for de fleste greenfield big data implementeringer af 2019 (ikke meget over et år fra nu), der stadig efterlader masser af organisationer, der vil være jonglering on premise og cloud-implementeringer.

MapR ‘ s nye Bane Sky Suite-adresser organisationer planlægning til at styre eller tier lagring af data for hybrid på præmissen/cloud-implementeringer. Det understøtter to-vejs udveksling af data fra on-premise til skyen og tilbage.

MapR Bane Suite tager fordel af det globale navneområde kapacitet, der allerede er indbygget i MapR ‘ s proprietære file system (for nylig omdøbt MapR-XD). På almindeligt dansk, det betyder, at du kan gemme metadata selv, hvis det er gemt på en særskilt klynge; det er en evne, at open source Apache HDFS mangler. De metadata, der kan dække alt fra fil og/eller et bord navn, datatype, sikkerhed tilladelser, og så videre. Den nye Bane Suite har automatiserer, hvad der ville have tidligere krævede kompliceret manuel kodning.

Med den nye Bane-Suite, metadata management strækker sig til data, der opbevares i sky objekt, storage-systemer; i første omgang, AWS S3 og Azure BLOB Storage er understøttet, med Google Cloud Storage til at komme senere. Det fører til en evne, der har længe været en fast bestanddel af klassisk information lifecycle management: opbevaring prioriteringsordning. Prioriteringsordning bruges til lagring af data i den mest cost-effektive sted.

Traditionelt, ville dette have betydet, at flytte aging data fra lokal disk til højere kapacitet nær-line eller offline arkivering. Men opbevaring prioriteringsordning i dag er en langt mere kompliceret balancegang, fordi der er så mange nye muligheder. I den høje ende, i-hukommelse, et SSD flash, og (snart) NVRAM opbevaring gør det økonomisk at bruge silicium til krævende applikationer. Hadoop er HDFS tilføjet muligheder for aktiv arkivering brug sager, hvor data, der normalt ville have været bortskaffes eller kastet ud arkiv er tilgængelig for big data analytics tak til scale-out commodity hardware og billige disk. Nu tilføje cloud storage til ligningen, der giver muligheder, der er endnu billigere end HDFS. Det er en ligning der mange Amazon EMR kunder ofte balance.

Når du har flyttet data til cloud storage, ny Bane Suite giver dig også mulighed til bestemmelse beregne klynger samt hjælp native Api ‘ er, i første omgang for AWS og Azure, Google Cloud støtte til at komme senere. Det er en separat indstilling for kunder, der ønsker for at flytte data til en billigere opbevaring, men endnu ikke har behovet for at dreje op beregne. Derudover, den nye Bane Suite tilbyder runder MapR Kant IoT-forbehandling tilbyder ved at tilføje mulighed for at flytte data i reel tid til skyen, ikke bare til on-premise-klynge.

Managed cloud-tjenester forventes at levere operationelle enkelhed, men den rigdom af muligheder, som de tilbyder, kan kaste nyt valg og kompleksiteten i mix. Med sin nye Bane, Suite med, MapR er løse, hvad der vil blive en af mange sleeper spørgsmål for dem, der omfavner hybrid cloud strategier.

0