Sie können nicht erkennen, aber Hadoop schon seit bereits 10 Jahren. Selbst jetzt, da die meisten Organisationen haben in der einen oder anderen Weise angenommen, ist es, nicht alles über es ist offensichtlich und klar. Aber, wenn es kam zuerst von Yahoo im Jahr 2006, Dave Mariani, AtScale ist co-Gründer und CEO, war einer der ersten, es zu benutzen und erkennen Ihr Potenzial.
Er war am richtigen Ort zur richtigen Zeit: Mariani Tat analytics, Yahoo, Bereitstellung der Daten für geschäftliche Einblicke und Werbung auf die Vermögenswerte des Unternehmens. DW und Würfel waren so ziemlich das einzige Spiel in der Stadt für die Analytik dann, und ein großes Spiel zu. Mariani, einem Daten-cube-veteran mit zahlreichen Implementierungen unter seinem Gürtel, erwähnt, dass “eine einzelne dieser Würfel auf Yahoo fahren konnte der Umsatz im Bereich von 50 Millionen US-Dollar”.
Mariani, wie die meisten Industrie-Experten heute, erkannte, dass Hadoop revolutionieren könnten die Daten der Industrie aufgrund seiner Eigenschaften: eine shared-nothing-Architektur, das bedeutet, es können scale-out in eine nahtlose, kostengünstige Weise, einen Rahmen für die ETL-und Verarbeitung von Aufträgen ausgeführt werden kann, und die späte Bindung / schema Lesen. Er erkannte, dass früher als die meisten, oder zumindest wirkte er auf Sie früher.
Bei Yahoo, als auch bei Klout, die Mariani trat nach Yahoo, Hadoop wurde stark genutzt wird, aber der BI-Landschaft war, was es immer war: fragmentiert, mit einer Vielzahl von Werkzeugen, angefangen von Excel to MicroStrategy. Zu dieser Zeit, die einzige Möglichkeit, diese Werkzeuge bedienen zu können, um die gespeicherten Daten in Hadoop wurde, um Daten aus Hadoop und speichern Sie es in einem DW. Dann SQL-on-Hadoop kam, Cloudera festgelegten release Impala, Mariani rekrutiert wurde, und der rest ist Geschichte.
Schließlich Mariani sich an die Umsetzung seiner eigenen vision: um Benutzern den Zugriff auf Daten in Hadoop so schmerzlos wie möglich. Das Fahrzeug wurde AtScale, mit Yahoo und Cloudera an Bord, die als Investoren und Kunden. AtScale bewusst verzichtet, bietet eine Daten-navigation und Visualisierung-Schicht. Ihr denken war, dass Sie konnte und würde nicht verdrängen tools, die bereits für diesen Zweck verwendet. Stattdessen haben Sie sich entschieden, zu handeln, als eine herstellerunabhängige middleware zu erleichtern, Zugriff auf Daten in Hadoop über SQL-und MDX. Diese Architektur basiert auf 3 Säulen.

AtScale-Architektur wurde entwickelt, um Benutzern zu ermöglichen, den Zugriff auf Daten in back-end-Systeme in einer nahtlosen Art und Weise, indem Sie Ihre BI-tool der Wahl. Bild: AtScale
Design, Cache, Abfrage –
Erstens, die Design-Center. AtScale beschreibt dies als Leinwand für die Malerei virtuelle cubes. Dieses tool ermöglicht den Benutzern das navigieren gespeicherten Daten in Hadoop-und Metadaten definieren, die wiederum verwendet werden, definieren Sie die Dimensionen für virtuelle OLAP-cubes. Es ist eine kollaborative multi-user-tool, so dass Benutzer können sich gegenseitig ergänzen wissen.
Zusätzlich, um effektiv zu handeln, wie eine schema-definition, Mechanismus, es unterstützt auch data governance-durch den Zugang Regeln und Sicherheit. AtScale spricht hier von einem Universellen Semantischen Schicht, die Geschäftslogik kann zentral definiert werden und bereitgestellt werden, sofort, egal was für BI-tools, die verwendet werden.
Virtuelle cubes cool klingen, aber was ist mit performance? Es gibt einen Grund, warum die Würfel in der traditionellen DW werden berechnet, nachdem alle. Dies ist, wo das Adaptive Cache kommt. Die 2. Ebene in AtScale Architektur ist ein caching-Mechanismus funktioniert durch die Anwendung intelligenter Strategien, um nicht nur zu halten, die die zuletzt und Häufig verwendete Daten in speichern für einen schnelleren späteren Zugriff, sondern auch, um vorherzusagen, Daten eher in der Zukunft verwendet werden und präventiv Sie zu Holen.
AtScale argumentiert, dass sogar körperliche Würfel beginnen zu brechen für große kardinalitäten / Dimensionen und Ansprüche, die virtuelle cubes führen Sie genauso gut oder sogar noch besser. Sie nennen ein Beispiel, in dem eine Abfrage auf einem virtuellen Würfel mit über 500 Milliarden Zeilen abgerufen Ergebnisse in unter ein paar Sekunden.
Last but not least, die näher AtScale ruft an einen Benutzer gerichteten Schnittstelle: die treffend benannten Hybrid-Abfrage-Service (HQS), bietet einen Abfrage-layer und unterstützt sowohl SQL-und MDX. HQS unterstützt JDBC, was bedeutet, dass effektiv alle ANSI-SQL-client eine Verbindung herstellen kann über AtScale über die JDBC-query-Daten, die in Hadoop. AtScale Partnerschaften und Zertifizierungen im Ort, für Produkte wie Tableau, Qlik und PowerBI, basierend auf Benutzer-Basis und-Anforderungen, sowie alle wichtigen Hadoop-distribution-Anbieter.
Als AtScale CEO Dave Mariani sagt, “Wenn niemand kann die Interaktion mit Ihrem cluster, Hadoop ist nur ein weißer Elefant.” Jetzt ist der Elefant aus der box, Rollen mit der Zeit.
Aus dem Hadoop-box
Neu ist, dass jetzt AtScale geht über Hadoop (in der cloud oder on-premise), bietet Unterstützung für Teradata-DW, Google Dataproc und BigQuery. Nach AtScale Gründer, dies war Teil Ihrer vision, alle zusammen, und die Kunden haben gefragt, für Sie zu. Diese vision wurde zunächst auf Skepsis, während die Kapitalbeschaffung für AtScale die Serie Ein, aber die Dinge waren viel einfacher, jetzt, da das Unternehmen wurde vor kurzem in der Lage, eine Series B über US$ 11 Millionen.
AtScale Strategie als die Mitte der Mensch scheint sich zu lohnen, da es ermöglicht, aufbauend auf den Entwicklungen der SQL-engines verwendet wird. Diese Motoren wurden dabei aus, dass gemessen wurde, um bieten eine 2-3-fache Verbesserung in der Leistung im Vergleich zu früheren Versionen.
AtScale hat das “entkoppeln alles” – Paradigma, dass Hadoop gebracht, um die storage-Welt, durch hinzufügen Ihrer eigenen Daten definition und Abfrage-Optimierung-Schicht auf der Oberseite der Lagerung, sei es, Hadoop oder andere, wie die roadmap beinhaltet die Unterstützung für noch mehr Speicher-engines.
Dies ist die Geschichte von TOAD spielen in der brave Hadoop-Welt und darüber hinaus? Wie TOAD, AtScale begann mit einer bescheidenen vision – das Leben der Menschen mit Daten arbeiten, die leichter, auf Oracle und Hadoop-beziehungsweise. Wie TOAD, AtScale wurde sehen wachsende Annahme (Liste Kunden wie Macy ‘ s, Comcast und GlaxoSmithKline) und erweitert sich über seine erste Nische.
KRÖTE und AtScale sogar überschneiden sich irgendwie jetzt, als TOAD bietet Unterstützung für SQL-on-Hadoop-auch – wenn auch ohne all die extras, die AtScale bringt auf den Tisch. Sieht aus wie Hadoop ist out of the box, und in einen konvergierenden Datenbank-Welt, die als keine überraschung kommen sollte.