Dremio, ein Unternehmen, das sich seit langem auf die Anpassung von Business-Intelligence-Workloads auf Data Lakes konzentriert, führt heute Dremio Cloud ein, einen Managed Service für genau dies auf Daten, die in Amazon Web Services S3 gespeichert sind . Dremio Cloud baut auf der im letzten Monat angekündigten AWS-Edition von Dremio auf, ist jedoch eine vollständige SaaS-Implementierung und fügt eine Reihe einzigartiger Funktionen hinzu.
Lesen Sie auch: Dremio stellt AWS-Version und neue Funktionen für die Cloud vor Data Lakes
Neues
ZDNet sprach mit Dremios Gründer und Chief Product Officer Tomer Shiran, der erklärte, dass das Paradigma für Dremio Cloud eine globale Steuerungsebene mit einem zentralen Abfrageplaner ist, der Abfragen zu S3-Daten, die in Amazon-Regionen gespeichert sind, und Daten in T-Shirt-Größe sendet “Engines” (eigentlich Cluster), um die Abfragen auszuführen. Die Engines können auf automatischer Skalierungsbasis repliziert werden, um das zu unterstützen, was Dremio als “unendliche Parallelität” bezeichnet
Eine weitere einzigartige Funktion von Dremio Cloud sind die Single-Sign-On-Funktionen, die eine Reihe von Identitätsanbietern für Unternehmen und Verbraucher/soziale Identitäten unterstützen, darunter Azure Active Directory, Okta, Ping und Google Identity. In ähnlicher Weise wird Benutzern von Tableau und Microsofts Power BI die einmalige Anmeldung bei Dremio basierend auf den Anmeldeinformationen unterstützt, die sie für die Anmeldung bei diesen BI-Tools verwenden.
Abrechnung und Verfügbarkeit
Die Abrechnung für Dremio Cloud erfolgt nutzungsbasiert, wobei die Engine-Rechenressourcen die Einheit des abrechenbaren Umsatzes sind. Wenn statt nur einer mehrere Engine-Replikate instanziiert werden, wird die Abrechnung höher ausfallen. Wenn keine Anfragen berücksichtigt werden müssen, laufen alle Motoren herunter und dem Kunden entstehen keine Gebühren. Mit anderen Worten, es werden weder die Steuerebene noch die Ressourcen des Leerlaufmotors in Rechnung gestellt (zumal letztere effektiv verschwinden, wenn sie nicht verwendet werden).
Dremio Cloud ist jetzt in “begrenzter Verfügbarkeit” (dh auf Einladung angeboten), aber Shiran sagt, dass die Veröffentlichung GA-Kaliber ist und dass der Dienst bereits seit einiger Zeit in der Betaphase ist. Der Dienst wird exklusiv für Amazon Web Services eingeführt, aber Shiran sagte, dass das Unternehmen voraussichtlich noch in diesem Kalenderjahr in der Azure-Cloud von Microsoft und im nächsten Kalenderjahr in der Google Cloud starten wird.
Eigenschaften am See
pDremio bezeichnet seine Plattform als “SQL Lakehouse”, was ähnlich dem Data-Lakehouse-Branding von Databricks klingt. Als ich letzten Monat über seine Dart-Initiative schrieb, sagte ich sogar, dass die Plattform von Dremio wirklich ein vollständiges Data Warehouse ist, das zufällig mit Daten arbeitet, die in offenen Formaten gespeichert sind, auf Cloud-(oder On-Premise-)Objektspeicher. Shiran wies darauf hin, dass dies kein geringer Unterschied sei, da das Belassen von Daten in ihrem nativen Format im See bedeutet, dass Data Science, Data Lake und andere spezialisierte Engines mit denselben Daten arbeiten können, ohne dass sie verschoben oder kopiert werden müssen und gleichzeitig BI-Workloads möglich sind auszuführen.
Lesen Sie auch: Dremios Dart-Initiative festigt weiter See- und Lagerhaus-Paradigmen
Ich möchte auch darauf hinweisen, dass Daten in Data Warehouses über die Verwendung proprietärer Speicherformate hinaus in der Regel kuratierter und weniger umfassend sind als Daten im See, aber dass Dremio eine BI-Analyse von Daten ermöglicht, die vom breiteren Netz des Data Lake erfasst werden. Unabhängig davon erleben wir erneut die Konsolidierung der Data Warehouse- und Data Lake-Modelle und erleben, wie die Popularität von Cloud Data Warehouses und Cloud Data Lakes diese Konsolidierung zunehmend in einem Cloud-Kontext vollzieht.
Verwandte Themen:
Cloud Digitale Transformation Robotik Internet der Dinge Innovation Unternehmenssoftware