
Hadoop ist immer ein Substrat für künstliche Intelligenz
Getty Images/iStockphoto — MapR
Diese Woche MapR angekündigt, eine neue Lösung namens Quick-Start-Lösung (QSS), mit Schwerpunkt auf deep-learning-Anwendungen. MapR wirbt QSS als eine verteilte deep learning (DL) Produkt-und services-Angebot, das es ermöglicht, die Ausbildung von komplexen deep-learning-algorithmen im großen Maßstab.
Hier ist die Idee: nachhaltiges lernen erfordert viele Daten, und es ist Komplex. Wenn MapR Converged-Data-Plattform ist Ihre Daten-backbone, dann QSS bietet Ihnen alles, was Sie brauchen, um zu verwenden, Ihre Daten für die DL-Anwendungen. Es macht Sinn, und es ist im Einklang mit der MapR-Strategie.
MapR ist die erste Hadoop-Anbieter mit einem Angebot, das vermarktet wird, was wir nennen würde die künstliche Intelligenz (KI), die auf Hadoop. Aber nicht AI auf Hadoop Sinn mehr breit? Und was sind andere Hadoop-Anbieter es tun?
MapR hat Tiefe lernen
Denken Sie daran, wenn Hadoop zum ersten mal aus? Es war eine Plattform mit vielen Vorteilen, aber erforderlich ist, seine Nutzer zu gehen die extra Meile, um in der Lage sein, es zu benutzen. Das hat sich geändert. Jetzt Hadoop ist eine wachsende ökosystem, und ein großer Teil des Erfolgs ist durch das, was wir nennen SQL-on-Hadoop.
Hadoop war schon immer in der Lage, zu speichern und zu verarbeiten eine Vielzahl von Daten für Billig. Aber es war nicht, bis die Unterstützung für den Zugriff auf die Daten über SQL wurde gut genug ist, dass Hadoop wurde ein ernsthafter Anwärter als die enterprise-data-backbone. SQL war und ist es, die de-facto-standard für den Zugriff auf Daten. So unterstützt es bedeutete, dass Hadoop verwendet werden könnten, durch meist jeder.
AI und SQL sind unterschiedlich. Es ist nicht eine rückwärts-Kompatibilität, Rohstoff-feature. AI ist eine vorwärts-Suche, trending-Bereich. Aber auch heute, wenn AI ist ein Unterscheidungsmerkmal für diejenigen, die es haben, wie es aussieht, wird es bald etwas von einer Ware als auch diejenigen, die nicht haben, werden nicht in der Lage, zu konkurrieren.
AI und SQL sind auch ähnlich: Wenn Sie ein Hadoop-Anbieter, das ist nicht wirklich das, was Sie tun. Dies ist etwas, das andere tun-Sie müssen nur sicherstellen, dass es auf deiner Plattform, wo alle Daten ist. Dies ist, was MapR ist out, zu erreichen mit QSS zu.
MapR nutzt open-source-container-Technologie (denke das Andockfenster) und Orchestrierungs-Technologie (denke Kubernetes) zum bereitstellen von deep-learning-tools (denke TensorFlow) in einer verteilten Weise. Keiner dieser Technologie zu tun hat mit MapR, aber der Wert QSS bringt, ist im sicherstellen, dass alles funktioniert nahtlos zusammen.
Die verbreitet Tiefe lernen MapR – QSS schlägt vor, drei Ebenen. Die Unterste Ebene ist die Daten-Schicht, die mittlere Schicht ist die Orchestrierung Schicht und die oberste Schicht ist die Anwendungsschicht.
Bild: MapR
Ted Dunning, MapR chief application architect, erklärt: “Der beste Ansatz für die Verfolgung der KI/Deep learning ist die Bereitstellung einer skalierbaren, konvergenten Daten-Plattform, die unterstützt die neueste deep-learning-Technologien mit einer zugrunde liegenden enterprise-data-Stoff mit nahezu unbegrenzt skalieren.”
Er stellt fest, dass “fast alle der machine-learning-software entwickelt, die unabhängig von Hadoop und Spark. Dies erfordert eine Plattform, wie MapR, die fähig ist, unterstützt als Hadoop/Spark-workloads sowie traditionelle Dateisystem-APIs.”
Und da das funktioniert hat, warum nicht nutzen Sie auch MapR-DB-und MapR-Streams und MapR-FS zu ernähren, Ihre Daten und MapR Persistent Application Client Container (PACC) implementieren Sie Ihr Modell? Oh, und wir haben Dienstleistungen für Sie zu-wir werden Ihnen helfen. Das ist MapR die Nachricht mit QSS.
Anil Gadre, MapR chief product officer, sagt: “DL bereitstellen können Tiefe transformatorische Möglichkeiten für eine Organisation. Unser know-how…gepaart mit [unserer] einzigartiges design…bilden die Grundlage für [QSS]. QSS wird es Unternehmen ermöglichen, schnell nutzen moderne GPU-basierte Architekturen und legen Sie Sie auf dem richtigen Weg für die Skalierung Ihrer DL Bemühungen.”
AI auf Hadoop
Also, das ist AI, die auf Hadoop ein Ding? Im Gegensatz zu SQL gibt es keinen standard für AI. Es gibt keine allgemein anerkannte und allgemeingültige definition selbst. DL ist nur ein Teil des machine learning (ML), die nur einen Teil des AI. Und auch innerhalb DL, zwar gibt es einige gemeinsame Konzepte, es gibt keine solche Sache wie eine gemeinsame API. So QSS ist DL auf Hadoop, aber nicht wirklich AI, die auf Hadoop.
Es ist mehr AI als maschinelles lernen, und es gibt mehr zu machine learning als die Tiefe lernen.
Bild: Nvidia
Die Vorstellung mit einem Daten-und compute-Plattform wie Hadoop als Substrat für AI ist eine Natürliche. Aber laufen können ML oder DL auf Hadoop nicht wirklich eine Hadoop-Anbieter eine AI-Anbieter zu. Dies ist eine Diskussion, die wir gehabt haben mit vielen Hadoop-Verkäufer Führungskräfte in den letzten paar Monaten.
Für Cloudera CEO Tom Reilly, “ML ist sehr real und sehr aktiv, es ist hier und jetzt und es tut große Dinge in der Praxis. Unsere Kunden sind versuchen zu verstehen, AI und was liegt auf Ihrer Reise in die Zukunft. Wir helfen Ihnen mit ML, unsere Plattform unterstützt bereits ML und wird auch weiterhin um Unterstützung für diese hinzufügen. Wir denken, unsere Plattform als host für die Daten, die die Leute für “AI”.
Cloudera hat gewesen kritisiert für seinen Versuch darstellen als AI-Unternehmen in seiner jüngsten IPO-filing. Zu den besten unseres Wissens, Cloudera nicht über umfangreiche interne know-how auf AI. Es ist ein data-science-team, bestehend aus einer Handvoll Leute, und es ist auch die kürzlich erfolgte Akquisition von Sinn.io.
Sinne.io integriert wurde in Cloudera Stapel und aufbereiten wie Cloudera Data-Science-Workbench (CDSW). In einer kürzlichen Diskussion mit Sean Owen, Cloudera Data Science Director, Owen verglichen Sinn.io IBM DataWorks.
“Durch die Bereitstellung von Zugang zu Daten, CDSW sinkt die time-to-value des AI-Anwendungen geliefert, mit unseren automatisierten ML-Plattform”, stellt Jeremy Achin, DataRobot CEO. Das ist großartig, aber es ist nicht wirklich AI, oder?
Für Scott Gnau, CTO bei Hortonworks, AI besteht aus zwei Hauptkomponenten: lädt Daten plus Verpackung und algorithmen zum Durchlaufen der Daten. Hortonworks unterstützt, und als AI gewinnt, Hortonworks, gewinnt auch. Gnau, betont jedoch, was er sieht, wie Hortonworks’ stärken, nämlich die enterprise-governance und-Sicherheit.
Gnau glaubt, wir sind noch zu sehen, neue Technologie in AI, wir haben noch nicht geträumt. So Hortonworks’ Ansatz ist eine Investition in die Infrastruktur und werden den Vertrauenswürdige Lieferant von Daten, während ein Auge auf die auftauchenden killer-Technologie und-Anwendungen Sie können plug-in aus der Perspektive der Anwendung.
Jeder Verkäufer Vorgehen muss gesehen werden im Kontext von wo Sie jetzt sind und wie Sie sich weiterentwickelt. AI ist ein neues Schlachtfeld, dass Anbieter Ansatzes im Einklang mit Ihrer Philosophie und Ziele. Wir werden weiterhin mit einer Analyse, wie sich diese manifestieren sich in AI in einem späteren post.