MapR platform update bringer større AI-og Analytics-innovation…via filsystemet

0
138

Nul

Fra starten af sit indlæg til markedet, MapR fokuseret på det filsystem som en akse af innovation. I erkendelse af, at de indfødte Hadoop Distributed File System (HDFS er) manglende evne til at rumme opdateringer til filer var en stor blokering for masser af Virksomhedens kunder, MapR sætte en HDFS interface via standard Network File System (NFS) ved at gøre, som tvang den til at gå væk.

Mens tilsyneladende enkle, evnen til Hadoop for at se et standard fil system som sin egen betydet, at masser af data, der allerede er til stede i Virksomheden kunne behandles af Hadoop. Det betød også, at ikke-Hadoop-systemer kan udveksle data og arbejde sammen med Hadoop. Det gjorde Hadoop mere økonomisk, mere handlingsorienteret og mere relevante. For mange kunder er det omdannet Hadoop fra en marginal teknologi til et kritisk.

Tilbage til filsystemet
Mens MapR har efterfølgende gennemgået på den database, streaming og kant computing lag, og har taget container teknologi, det er i dag annoncerer en større platform update, der går tilbage til file system innovation. Men denne gang er det ikke bare om at lave filer update-stand; det handler om at integrere flere file system teknologier, på arbejdspladsen og i skyen, og få dem til at arbejde sammen.

Læs også: Kafka 0,9 og MapR Vandløb sætte streaming data i søgelyset
Læs også: MapR får container religion med Platform til Docker

Kernen i innovation er omkring integration mellem MapR file system (MapR-FS) og Amazons Simple Storage Service (S3) – filsystemet protokoller. Denne integration manifesterer sig i mere end én formular, og der er noget subtilt her, så bær over med mig.

S3, for to
Den første integration punkt er støtte til en S3 interface over MapR-FS, via den nye MapR Objekt Data Service. Dette gør det muligt for programmer, der er S3-kompatible at læse og skrive data, der er gemt i MapR-FS. Da S3-protokollen understøttes ikke bare ved S3 sig selv, men også ved on-premises fil-systemer, økosystemet støtte til den protokol, der er robust. Nu MapR-FS er en del af det økosystem.

object-data-service.jpg

MapR Objekt Data Service

Kredit: MapR

Men integrationen stopper ikke der; det virker i den anden retning også. Det vil sige, at S3-kompatible lagerenheder, herunder faktiske S3 spande i Amazon Web Services (AWS) cloud, kan blive forenet i MapR-FS, hvilket giver en mere økonomisk opbevaring mulighed for at rumme data, som programmer skal kun sjældent adgang.

Premium niveauer
MapR-FS nu også omfatter sletning kodning til hurtigt at indtage, ideelt set på en solid state disk (SSD) – medier. Sammen med standard-S3-kompatibel opbevaring og indfødte MapR-FS, dette giver mulighed for fuld-på lager prioriteringsordning, så hvad MapR kalder en “multi-temperatur” data platform. Kunder kan sætte hot (ofte adgang til) data om performance-optimeret Ssd ‘ er; varm (sjældent adgang til) data på konventionelle roterende diske, og koldt (sjældent adgang til) data på S3-kompatibel opbevaring, herunder Amazon S3 sig selv.

Differentieret lagring er katalysator for at holde alle data, der er tilgængelige, på en økonomisk effektiv måde. Som igen giver mulighed for analytics og AI til at være langt mere effektiv og kraftfuld. Du kan aldrig vide, hvornår at gamle data vil være vigtig i en bestemt analyse motion. Og nogle gange er den bedste machine learning modeller er dem, der har været bygget på dybe, historiske data, ud over at de for nylig-indsamlet række.

Må ikke bare gøre det muligt, gør det nemt
Men differentieret lagring kan ikke gøre det muligt for alle, at hvis det er bare en manuel storage-strategi. Heldigvis, denne nye MapR platform release gør placering af forskellige data på forskellige medier automatiseret, gennem deklarativ politik, og alle data niveauer er forenet i et enkelt namespace, så de føler sig som en enkelt fil system.

Der er meget mere:

Vigtigt performance optimeringer, herunder placeringen af metadata og fil-stumper i den indfødte MapR-FS lag for S3 dataSecurity funktioner som automatisk kryptering af alle data som standard og Sikker Fil-baserede tjenester med NFSv4Simple FÅ og operationer til at flytte data mellem fysisk lag Stærke funktioner som planlagt eller automatisk fil huske at flytte data fra højere latency niveauer til lavere latency niveauer, når det bliver nyligt relevantSupport for fejltolerance egenskaber som disaster recovery klynger i skyen gennem spejling fra MapR klynge til MapR-XD cloud storage i AWS, Google Cloud Platform og Microsoft Azure

Læs også: MapR diversificerer til cloud storage-markedet
Læs også: MapR Fil System, der er valgt af SAP til cloud storage layer

I tillæg til ovenstående, MapR integration af Apache Gnist 2.3 og Bor 1.14; støtte til Kafka KSQL; og MapR-DB-sprog, Python-bindinger for og Node.JS gøre analytics og AI mere tilgængelige for en bred vifte af udviklere og brugere i erhvervslivet. Denne tilgængelighed er et fremragende supplement til den ekstra aktivering fastsat af differentieret lagring.

Af tanker
Hjertet af big data analytics og faktisk AI involverer store mængder af rå data, der er gemt som hjemme (afgrænset, JSON, XML, etc.) filer. Det gør fil-systemet i sig selv kritisk i operationalizing og optimere analytics og AI. Tilføjelse af indvinding lag på tværs af de mange forskellige lagringsteknologier og steder, der findes i dag, både på-prem-og cloud-baseret, er nøglen til at bryde data siloer og foretage de nødvendige data er let tilgængelige. Og det er det, der gør en overlegen analytics og machine learning muligt.

Denne seneste MapR platform release vil være tilgængelig i tredje kvartal af dette år, dvs inden for de næste tre kalendermåneder.

Relaterede Emner:

Cloud

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software

0