Dremio lancia il servizio cloud “SQL Lakehouse”

0
189

Andrew Brust

di Andrew Brust per Big on Data | 21 luglio 2021 — 13:30 GMT (14:30 BST) | Argomento: Big Data Analytics

Dremio, un'azienda da tempo impegnata nell'accogliere i carichi di lavoro di business intelligence sui data lake, lancia oggi Dremio Cloud, un servizio gestito per fare proprio questo, sui dati archiviati in Amazon Web Services S3 . Dremio Cloud si basa sull'edizione AWS di Dremio annunciata il mese scorso, ma è un'implementazione SaaS completa e aggiunge una serie di funzionalità uniche.

Leggi anche: Dremio introduce la versione AWS, nuove funzionalità per il cloud data lake

Novità

ZDNet ha parlato con il fondatore e chief product officer di Dremio, Tomer Shiran, che ha spiegato che il paradigma per Dremio Cloud è uno di un piano di controllo globale con un pianificatore di query centralizzato che invia query sui dati S3 archiviati nelle regioni Amazon e dati delle dimensioni di una maglietta “motori” (cluster, in realtà) per eseguire le query. I motori possono essere replicati su una base di scalabilità automatica per supportare ciò che Dremio chiama “concorrenza infinita”

Un'altra caratteristica esclusiva di Dremio Cloud è la funzionalità Single Sign-On che supporta numerosi provider di identità aziendali e consumer/sociali, tra cui Azure Active Directory, Okta, Ping e Google Identity. In modo simile, gli utenti di Tableau e Power BI di Microsoft sono supportati per il Single Sign-On a Dremio in base alle credenziali che utilizzano per accedere a tali strumenti di BI.

Fatturazione e disponibilità

La fatturazione per Dremio Cloud è basata sull'utilizzo, con le risorse di elaborazione del motore che rappresentano l'unità delle entrate fatturabili. Quando vengono istanziate numerose repliche del motore, anziché una sola, la fatturazione sarà più elevata. Quando non è necessario soddisfare le richieste, tutti i motori si arrestano e il cliente non dovrà sostenere alcun costo. In altre parole, non vengono fatturate né il piano di controllo né le risorse del motore inattivo (soprattutto perché quest'ultimo scompare di fatto quando non viene utilizzato).

Dremio Cloud è ora in “disponibilità limitata” (ovvero offerto su invito) ma Shiran afferma che la versione è di calibro GA e che il servizio era già in beta da un po' di tempo. Il servizio verrà lanciato esclusivamente per Amazon Web Services, ma Shiran ha affermato che la società prevede di essere lanciato sul cloud Azure di Microsoft entro la fine dell'anno solare e su Google Cloud il prossimo anno solare.

Proprietà Lakefront

Dremio chiama la sua piattaforma “SQL Lakehouse”, che suona in modo simile al marchio Data Lakehouse di Databricks. Infatti, quando ho scritto della sua iniziativa Dart il mese scorso, ho detto che la piattaforma di Dremio era davvero un data warehouse completo che funzionava semplicemente su dati archiviati in formati aperti, su cloud (o on-premise) object storage. Shiran ha sottolineato che questa non è una piccola distinzione, poiché lasciare i dati nel loro formato nativo nel lago significa che la scienza dei dati, il data lake e altri motori specializzati possono operare su quegli stessi dati, senza richiedere lo spostamento o la copia, e pur consentendo carichi di lavoro BI da eseguire.

Leggi anche: L'iniziativa Dart di Dremio consolida ulteriormente i paradigmi del lago e del magazzino

Vorrei anche sottolineare che, oltre all'utilizzo di formati di archiviazione proprietari, i dati nei data warehouse sono in genere più curati e meno inclusivi dei dati nel lago, ma che Dremio sta consentendo analisi in stile BI sui dati catturati dalla rete più ampia del data lake. Indipendentemente da ciò, stiamo nuovamente assistendo al consolidamento dei modelli di data warehouse e data lake e assistiamo a come la popolarità dei cloud data warehouse e dei cloud data lake stia portando sempre più quel consolidamento in un contesto cloud.

Argomenti correlati:

Cloud Trasformazione digitale Robotica Internet delle cose Innovazione Software aziendale Andrew Brust

Di Andrew Brust per Big on Data | 21 luglio 2021 — 13:30 GMT (14:30 BST) | Argomento: Analisi dei Big Data