Dremio lanserer “SQL Lakehouse” skytjeneste

0
131

 Andrew Brust

Av Andrew Brust for Big on Data | 21. juli 2021 – 13:30 GMT (14:30 BST) | Emne: Big Data Analytics

Dremio, et selskap som lenge har fokusert på å imøtekomme arbeidsmessig intelligens på datavann, lanserer i dag Dremio Cloud, en administrert tjeneste for å gjøre nettopp det, på data lagret i Amazon Web Services S3 . Dremio Cloud bygger på Dremios AWS-utgave som den kunngjorde i forrige måned, men det er en full SaaS-implementering, og legger til en rekke unike funksjoner.

Les også: Dremio introduserer AWS-versjon, nye funksjoner for sky datasjøer

Nye ting

ZDNet snakket med Dremios grunnlegger og produktansvarlige, Tomer Shiran, som forklarte at paradigmet for Dremio Cloud er et av et globalt kontrollplan med en sentralisert spørreplanlegger som sender forespørsler om S3-data lagret over Amazon-regioner, og data med T-skjorte “motorer” (klynger, egentlig) for å gjennomføre spørsmålene. Motorene kan replikeres på automatisk skalering for å støtte det Dremio kaller “uendelig samtidighet”

En annen funksjon som er unik for Dremio Cloud er muligheter for enkel pålogging som støtter en rekke leverandører av bedrifter og forbruker/sosiale identiteter, inkludert Azure Active Directory, Okta, Ping og Google Identity. På samme måte støttes brukere av Tableau og Microsofts Power BI for enkel pålogging til Dremio basert på legitimasjonen de bruker for å logge på disse BI-verktøyene.

Fakturering og tilgjengelighet

Fakturering for Dremio Cloud er bruksbasert, og ressursene for beregning av motorer er enheten for fakturerbar inntekt. Når mange motorreplikater blir instantiert, i stedet for bare en, vil faktureringen være høyere. Når det ikke er behov for spørsmål, vil alle motorer snurre ned, og kunden vil ikke bli belastet. Med andre ord faktureres verken kontrollplanet eller tomgangsmotorressursene (spesielt siden sistnevnte effektivt forsvinner når de ikke er i bruk).

Dremio Cloud er nå i “begrenset tilgjengelighet” (dvs. tilbys på invitasjon), men Shiran sier at utgivelsen er GA-kaliber og at tjenesten allerede hadde vært i beta i ganske lang tid. Tjenesten lanseres eksklusivt for Amazon Web Services, men Shiran sa at selskapet forventer å lansere på Microsofts Azure-sky senere dette kalenderåret og på Google Cloud neste kalenderår.

Lakefront-egenskaper

Dremio kaller plattformen sin for “SQL Lakehouse”, som høres ut som Databricks 'Data Lakehouse-merkevarebygging. Da jeg skrev om Dart-initiativet i forrige måned, sa jeg faktisk at Dremios plattform virkelig var et fullstendig datalager som nettopp tilfeldigvis opererte data lagret i åpne formater, på sky (eller lokalt) objektlagring. Shiran påpekte at dette ikke er et lite skille, siden det å legge igjen data i sitt opprinnelige format i sjøen betyr datavitenskap, data lake og andre spesialiserte motorer kan bruke samme data uten å måtte flytte eller kopiere, og samtidig tillate BI-arbeidsmengder å utføre.

Les også: Dremios Dart-initiativ konsoliderer sjø- og lagerparadigmer ytterligere

Jeg vil også påpeke at, utover bruk av proprietære lagringsformater, er data i datalager vanligvis mer kuraterte og mindre inkluderende enn data i innsjøen, men at Dremio muliggjør BI-stilanalyse av data fanget av datasjøens bredere nett. Uansett ser vi igjen konsolidering av datalager- og datasjømodellene, og blir vitne til hvordan populariteten til skydatalager og skydatasjøer i økende grad fører til at konsolidering skjer i en skykontekst.

Relaterte emner:

Cloud Digital Transformation Robotics Internet of Things Innovasjon Enterprise Software  Andrew Brust

Av Andrew Brust for Big on Data | 21. juli 2021 – 13:30 GMT (14:30 BST) | Tema: Big Data Analytics