MapR platform update ger stora AI Analytics och innovation…via filsystemet

0
116

Noll

Från början av sitt inlägg till marknaden, MapR fokuserat på att filsystemet som en axel av innovation. Att erkänna att de infödda Hadoop (Distributed File System HDFS s) oförmåga att ta emot uppdateringar till filer var en stor blockerare för många av Företagets kunder, MapR sätta en HDFS gränssnitt standard Network File System (NFS) för att göra denna begränsning att försvinna.

Även till synes enkla, möjlighet för Hadoop för att se en vanlig fil systemet som sin egen innebar att massor av data som redan finns i Företaget skulle kunna behandlas av Hadoop. Det innebar också att icke-Hadoop-system skulle kunna dela data och arbetar tillsammans med Hadoop. Som gjorde Hadoop mer ekonomiskt, mer värdefull och relevant. För många kunder, och den förvandlades Hadoop från en marginell teknik för att ett kritiskt.

Tillbaka till filsystemet
Medan MapR har därefter utvecklat på databasen, streaming och edge design och lager, och har anammat container teknik, är det i dag meddelar en viktig plattform uppdatering som går tillbaka till file system för innovation. Men den här gången är det inte bara handlar om att göra filer update-kunna, det handlar om att integrera flera filsystem teknik, lokalt och i molnet, och att få dem att fungera tillsammans.

Läs också: Kafka 0,9 och MapR Strömmar sätta strömmande data i rampljuset
Läs också: MapR blir behållare religion med Plattform för Docker

Kärnan av innovation runt om integration mellan MapR file system (MapR-FS) och Amazon Simple Storage Service (S3) file system protokoll. Denna integration manifesteras i mer än en form, och det är lite finkänslighet här, så stå ut med mig.

S3, för två
Den första integrationen punkt finns stöd för en S3-gränssnitt över MapR-FS, via den nya MapR Objekt Data Service. Detta gör att program som är S3-kompatibla för att läsa och skriva data lagras i MapR-FS. Eftersom S3-protokollet stöds inte bara av S3 själv, men också genom att på lokaler file system, ekosystem stöd för de protokoll som är robust. Nu MapR-FS är en del av ekosystemet.

object-data-service.jpg

MapR Objekt Data Services

Kredit: MapR

Men integrationen inte slut där; det fungerar i andra riktningen också. Det vill säga att S3-kompatibel lagring volymer, inklusive faktiska S3 hinkar i Amazon Web Services (AWS) moln, kan vara externa i MapR-FS, vilket ger en mer ekonomisk lagring alternativet för att klara av uppgifter till vilka applikationer behöver bara enstaka tillgång.

Premium nivåer
MapR-FS nu också innefattar utplåning kodning för att snabbt få i sig, helst på solid state disk (SSD) media. Tillsammans med standard S3-kompatibel lagring och infödda MapR-FS, detta gör det möjligt för full-on storage tiering, så vad MapR kallar en “multi-temperatur” data-plattformen. Kunder kan lägga hot (ofta nås) uppgifter om prestanda-optimerad Ssd-enheter; varm (nås sällan) uppgifter om konventionella snurrande skivor, och kallt (sällan nås) uppgifter om S3-kompatibel lagring, inklusive Amazon S3 själv.

Differentierad lagring är möjliggörare för att hålla alla uppgifter som är tillgängliga i ett ekonomiskt effektivt sätt. Som i sin tur gör det möjligt för analytics och AI för att vara långt mer effektiv och kraftfull. Du vet aldrig när det gamla uppgifter kommer att vara viktigt i en särskild analys motion. Och ibland är de bästa modeller är de som har byggt på djup, historiska data, utöver de mer nyligen insamlad mängd.

Inte bara gör det möjligt, att göra det lätt
Men skiktad lagring inte kan göra det möjligt för alla att om det bara är en manuell lagring strategi. Lyckligtvis, denna nya MapR plattform release gör placeringen av olika uppgifter på olika medier automatiserade, genom deklarativ politik, och alla data nivåer är sammanslagna i en enda namespace så att de känner sig som en enda fil systemet.

Det finns mycket mer:

Viktigt prestanda optimeringar, inklusive lokalisering av metadata och fil stubbar i de inhemska MapR-FS lager för S3 dataSecurity funktioner som automatisk kryptering av all data som standard och Säker Fil-baserade tjänster med NFSv4Simple FÅ och LÄGGA verksamheten att flytta data fysiskt mellan nivåer Stark funktioner som planerat eller automatisk fil påminna om att flytta data från högre latens nivåer till lägre latens nivåer när det blir nya relevantSupport för feltolerans funktioner som återställning kluster i molnet via spegling från MapR klustret för att MapR-XD moln lagring i AWS, Google Cloud Platform-och Microsoft Azure

Läs också: MapR diversifierar till moln lagring marknaden
Läs också: MapR Fil System som väljs av SAP för cloud lagring lager

I tillägg till ovanstående, MapR integrering av Apache Gnista 2.3 och Borra 1.14, stöd för Kafka KSQL, och MapR-DB språket Python-bindningar för och Node.JS gör analytics och AI mer tillgänglig för en rad olika utvecklare och företag. Denna tillgänglighet är ett utmärkt komplement till den extra aktivering som tillhandahålls av skiktad lagring.

Avslutande ord
Hjärtat av big data analytics och faktiskt AI innebär att stora volymer av rå data som lagras som en platt (avgränsat, JSON, XML, etc.) filer. Det gör filsystemet i sig kritisk i operationalizing och optimera analytics och AI. Lägga till abstraktionslager över många olika lagringstekniker och platser som finns idag, både on-prem och moln-baserade, är nyckeln till att bryta data silos och göra nödvändiga data lättillgängliga. Och som, i sin tur, är vad som gör den överlägsen analytics och maskininlärning möjligt.

Denna senaste MapR plattform versionen kommer att finnas tillgänglig under tredje kvartalet i år, det vill säga inom de närmaste tre kalendermånader.

Relaterade Ämnen:

Cloud

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem

0