Zero
Dès le début de son entrée sur le marché, MapR porté sur le système de fichiers comme un axe d’innovation. Reconnaissant que le natif Hadoop Distributed File System (HDFS) incapacité à adapter les mises à jour de fichiers a été un des principaux points de blocage pour beaucoup de clients de l’Entreprise, MapR mettre un HDFS interface sur la norme de Système de Fichiers Réseau (NFS) pour faire de cette contrainte de s’en aller.
Bien que d’apparence simple, la capacité pour Hadoop à voir un système de fichiers standard comme son propre signifié que beaucoup de données déjà présents dans l’Entreprise pourraient être traitées par Hadoop. Cela signifiait aussi que les non-Hadoop systèmes pourraient partager des données et de travailler en collaboration avec Hadoop. Que fait Hadoop, plus économique, plus utiles et les plus pertinentes. Pour de nombreux clients, il a transformé Hadoop à partir d’un marginal de la technologie à un niveau critique.
De retour au système de fichiers
Alors que MapR a innové par la suite sur la base de données, le streaming et le bord de l’informatique couches, et a adopté la technologie des conteneurs, il est aujourd’hui annonce une importante mise à jour de plateforme qui remonte au système de fichiers de l’innovation. Mais cette fois, il ne suffit pas de faire de mise à jour des fichiers; il est à propos de l’intégration de plusieurs fichiers système de technologies de, sur site et dans le cloud, et à les faire fonctionner ensemble.
Lire aussi: Kafka 0,9 et MapR Flux de mettre les données en continu dans le feu des projecteurs
Lire aussi: MapR obtient conteneur religion avec Plate-forme de menu fixe
Le cœur de l’innovation, c’est autour de l’intégration entre les MapR système de fichiers (MapR-FS) et de Amazon Simple Storage Service (S3) du système de fichiers de protocoles. Cette intégration se manifeste dans plus d’une forme, et il y a une subtilité ici, alors restez avec moi.
S3, pour deux
Le premier point d’intégration est un soutien pour un S3 interface sur MapR-FS, via le nouveau MapR Objet de Service de Données. Cela permet aux applications qui sont compatibles avec S3 pour lire et écrire des données stockées dans MapR-FS. Depuis le S3 protocole est pris en charge non seulement par la S3 en lui-même, mais aussi par les locaux sur les systèmes de fichiers, l’écosystème de support pour le protocole est robuste. Maintenant, MapR-FS est une partie de cet écosystème.

MapR l’Objet de Services de Données
Crédit: MapR
Mais l’intégration ne s’arrête pas là; il fonctionne dans l’autre sens aussi. C’est-à-dire que le S3 compatible avec des volumes de stockage, y compris les S3 d’Amazon Web Services (AWS), le cloud, peut être fédérés en MapR-FS, en fournissant un plus économique option de stockage en fonction des données pour les applications qui ont besoin seulement de rares accès.
Premium niveaux
MapR-FS maintenant intègre également l’effacement de codage rapide pour l’acquisition, idéalement sur solid state disk (SSD) dans les médias. Avec la norme S3 compatible stockage natif et MapR-FS, ce qui permet plein sur la hiérarchisation du stockage, permettant à ce MapR appelle un “multi-température de la plate-forme de données. Les clients peuvent mettre à chaud (fréquemment accédés) des données sur la performance optimisée des disques Ssd; chaud (rarement) des données sur les classiques des disques en rotation, et le froid (rarement consultés) les données sur les S3 compatible de stockage, y compris Amazon S3.
De stockage à plusieurs niveaux est le catalyseur de la conservation de toutes les données accessibles, économiquement efficace de la mode. Qui permet pour l’analyse et l’IA à être beaucoup plus efficace et puissant. Vous ne savez jamais quand les anciennes données sera important dans un exercice d’analyse. Et parfois, la meilleure machine de modèles d’apprentissage sont celles qui ont été construites sur des données historiques, en plus de la plus récemment prélevés dans la variété.
Ne vous contentez pas de le rendre possible; rendre facile
Mais la hiérarchisation du stockage, ne peut pas permettre à tous que si c’est juste un manuel de stratégie de stockage. Heureusement, cette nouvelle MapR pour la plate-forme rend le placement des différentes données sur différents supports automatisés, par le biais déclaratif de la politique, et toutes les données de niveaux sont fédérés dans un seul espace de noms afin qu’ils se sentent comme un système de fichiers unique.
Il y a beaucoup plus:
Important de l’optimisation des performances, y compris l’emplacement des métadonnées et des fichiers talons dans le natif MapR-FS couche pour S3 dataSecurity fonctionnalités telles que le réglage automatique de chiffrement de toutes les données par défaut et Sécurisé de Fichiers à base de services avec NFSv4Simple OBTENIR et de METTRE opérations de déplacer les données physiquement entre les niveaux de Fortes caractéristiques comme la date prévue ou automatique des fichiers de rappel pour déplacer les données de latence plus élevée à des niveaux inférieurs niveaux de latence quand il devient nouvellement relevantSupport pour la tolérance de panne caractéristiques comme la reprise sur sinistre clusters dans le cloud grâce à la mise en miroir de la MapR cluster de MapR-XD stockage dans le cloud AWS, Google Cloud Platform et Microsoft Azure
Lire aussi: MapR se diversifie de stockage sur le cloud du marché
Lire aussi: MapR Système de Fichier choisi par SAP cloud couche de stockage
En outre, MapR de l’intégration de Apache Spark 2.3 et Percer 1.14; le soutien aux Kafka KSQL; et MapR-DB liaisons de langage pour Python et Node.JS faire de l’analytique et de l’IA plus accessibles à une grande variété de développeurs et d’utilisateurs de l’entreprise. Cette accessibilité est un excellent complément à l’apport d’activation fourni par le stockage à plusieurs niveaux.
La séparation des pensées
Le cœur du big data analytics et en effet l’IA implique d’importants volumes de données brutes stockées en tant que plat (délimité, JSON, XML, etc.) les fichiers. Que fait le système de fichiers lui-même essentiel dans la mise en œuvre et l’optimisation de l’analytique et de l’IA. L’ajout de couches d’abstraction à travers les différentes technologies de stockage et les emplacements disponibles aujourd’hui, à la fois sur les prem et sur le nuage, est la clé pour briser les silos de données et les données facilement accessibles. Et qui, à son tour, est ce qui rend nos analyses de qualité supérieure et de machine learning.
Cette dernière MapR pour la plate-forme sera disponible au troisième trimestre de cette année, c’est à dire dans les trois mois de calendrier.
Rubriques Connexes:
Cloud
Transformation Numérique
La robotique
L’Internet des objets
L’Innovation
Des Logiciels D’Entreprise
0