Dremio lanceert cloudservice “SQL Lakehouse”

0
81

Andrew Brust

Door Andrew Brust voor Big on Data | 21 juli 2021 — 13:30 GMT (14:30 BST) | Onderwerp: Big Data Analytics

Dremio, een bedrijf dat zich lange tijd heeft gericht op het accommoderen van business intelligence-workloads op datameren, lanceert vandaag Dremio Cloud, een beheerde service om precies dat te doen, op gegevens die zijn opgeslagen in Amazon Web Services S3 . Dremio Cloud bouwt bovenop de AWS-editie van Dremio die vorige maand werd aangekondigd, maar het is een volledige SaaS-implementatie en voegt een aantal unieke functies toe.

Lees ook: Dremio introduceert AWS-versie, nieuwe functies voor de cloud data lakes

Nieuwe dingen

ZDNet sprak met de oprichter en chief product officer van Dremio, Tomer Shiran, die uitlegde dat het paradigma voor Dremio Cloud er een is van een wereldwijd controlevlak met een gecentraliseerde queryplanner die query's verzendt over S3-gegevens die zijn opgeslagen in Amazon-regio's, en gegevens ter grootte van een T-shirt “engines” (clusters, eigenlijk) om de query's uit te voeren. De engines kunnen worden gerepliceerd op basis van automatisch schalen om te ondersteunen wat Dremio 'oneindige gelijktijdigheid' noemt

Een andere unieke functie van Dremio Cloud zijn de mogelijkheden voor eenmalige aanmelding die een aantal zakelijke en consumenten-/sociale identiteitsproviders ondersteunen, waaronder Azure Active Directory, Okta, Ping en Google Identity. Op een vergelijkbare manier worden gebruikers van Tableau en Power BI van Microsoft ondersteund voor eenmalige aanmelding bij Dremio op basis van de inloggegevens die ze gebruiken om in te loggen bij die BI-tools.

Facturering en beschikbaarheid

Facturering voor Dremio Cloud is gebaseerd op gebruik, waarbij de rekenkracht van de engine de eenheid is van factureerbare inkomsten. Wanneer meerdere engine-replica's worden geïnstantieerd, in plaats van slechts één, zal de facturering hoger zijn. Als er geen vragen hoeven te worden beantwoord, draaien alle motoren uit en worden er voor de klant geen kosten in rekening gebracht. Met andere woorden, noch het besturingsvlak noch de inactieve motorbronnen worden gefactureerd (vooral omdat deze laatste effectief verdwijnen wanneer ze niet in gebruik zijn).

Dremio Cloud is nu in “beperkte beschikbaarheid” (d.w.z. aangeboden op uitnodiging), maar Shiran zegt dat de release GA-kaliber is en dat de service al geruime tijd in bèta was. De service wordt exclusief gelanceerd voor Amazon Web Services, maar Shiran zei dat het bedrijf verwacht later dit kalenderjaar te lanceren op de Azure-cloud van Microsoft en volgend kalenderjaar op Google Cloud.

Lakefront-eigendommen

Dremio noemt zijn platform een ​​”SQL Lakehouse”, wat lijkt op Databricks' Data Lakehouse-branding. Toen ik vorige maand over het Dart-initiatief schreef, zei ik zelfs dat het platform van Dremio echt een volledig datawarehouse was dat toevallig werkte op gegevens die waren opgeslagen in open formaten, op objectopslag in de cloud (of on-premises). Shiran wees erop dat dit geen klein verschil is, aangezien het achterlaten van gegevens in het oorspronkelijke formaat in het meer betekent dat datawetenschap, datalake en andere gespecialiseerde engines op diezelfde gegevens kunnen werken, zonder dat ze hoeven te worden verplaatst of gekopieerd, en terwijl BI-workloads nog steeds mogelijk zijn om uit te voeren.

Lees ook: Dremio's Dart-initiatief consolideert meer en magazijnparadigma's

Ik wil er ook op wijzen dat, naast het gebruik van eigen opslagformaten, data in datawarehouses doorgaans meer gecureerd en minder inclusief zijn dan data in the lake, maar dat Dremio BI-achtige analyse mogelijk maakt van data die door het bredere net van de data lake worden gevangen. Hoe dan ook, we zien opnieuw de consolidatie van de datawarehouse- en datameermodellen, en zien hoe de populariteit van clouddatawarehouses en clouddatameren er steeds meer toe leidt dat consolidatie plaatsvindt in een cloudcontext.

Gerelateerde onderwerpen:

Cloud Digital Transformation Robotics Internet of Things Innovatie Enterprise Software Andrew Brust

Door Andrew Brust voor Big on Data | 21 juli 2021 — 13:30 GMT (14:30 BST) | Onderwerp: Big Data-analyse