Due nuovi Azure analytics GA versioni, una di anteprima e una grande spinta in SQL DW

0
160

Microsoft sta facendo una sfilza di dati Azure annunci di oggi, su entrambi i dati di lago e di data warehouse fronti.

Primo, Microsoft Azure Dati Explorer (ADX) prodotto è stato rilasciato in GA (general availability). ADX, che ho scritto la settimana scorsa, è un Grande memorizzazione dei Dati, query e piattaforma di visualizzazione, con un talento speciale per l’analisi delle serie storiche.

Leggi anche: Velocemente, Microsoft partner di analytics in tempo reale con Dati Azure Explorer

(Dati lago) negozio è aperto per il business

A quel punto, Azure Dati Lago di Archiviazione (ADL) Gen2 colpisce GA oggi. A differenza della versione iniziale di RIPOSO, il Gen2 release funziona come un superset di Archiviazione Blob di Azure, ma i livelli un vero hierarchical file system su di esso, insieme con la capacità di gestire arbitrariamente file di grandi dimensioni. Hierarchical file system sono di prima classe, di sostegno per strutture di cartelle. Che è importante in Grandi applicazioni di Dati in cui i dati sono spesso partizionato, come i gruppi di sequenza di file separati da una cartella, il che comporterebbe a livello di cartella operazioni che possono trattare tutti i file in una cartella come una singola unità di dati.

Standard di cloud object storage, sistemi di tenere tutti i file in una radice-contenitore di livello, e di creare l ‘ “illusione” di cartelle incorporando i nomi delle directory nel file di metadati. La disponibilità di ADSL Gen2 essenzialmente darà Microsoft un due-tiered storage soluzione per contrastare Amazon S3. Mentre Amazon one-size-fits-all storia ha il vantaggio della semplicità, ADLS dà a Microsoft una grande soluzione di Dati, e uno che è basato sul suo oggetto, negozio tecnologia, piuttosto che essere completamente separato prodotto.

In questa prima release, ADLS Gen2 file system mancanza di compatibilità con Blob Storage APIs, ma che verrà aggiunto in seguito. Inoltre, c’è un sacco di sostegno diretto per Gen2, fuori dal cancello. Per esempio, Apache Hadoop 3.2, pubblicato il mese scorso, offre un supporto diretto per ADLS Gen2. Vari Big Data ecosistema di fornitori di Cloudera, Dremio e Arcadia Dati, si sono anche impegnati a RIPOSO. E nel mondo Microsoft, numerosi dei dati nel cloud, servizi, tra cui Azure Databricks, HDInsight, Alimentazione BI Azzurro e i Dati di Fabbrica, il sostegno di RIPOSO Gen2 direttamente, troppo.

Andiamo visual

Parlando di Azure Dati di Fabbrica (ADF), che il servizio sarà ora in grado di offrire dati visivi di flusso impianto, in anteprima pubblica. Mentre ADF ha da tempo fornito un visual designer per le orchestrazioni gestisce, dati effettivi di ingegneria di lavoro doveva essere fatto in script esterni che ADF potrebbe eseguire. Visual flussi di dati consentirà di dati ingegneria del lavoro stesso, deve essere fatto in un visual designer, che genera il codice dietro le quinte.

Leggi anche: Azure Dati di Fabbrica v2: Hands-on panoramica

ADF visual flussi di dati non deve essere confuso con il flusso di dati in funzione di Power BI, l’anteprima pubblica per la quale è stato annunciato tre mesi fa. Power BI i flussi di dati sono una nuvola di attuazione della società Power Query tecnologia, che consente anche di dati visivi lavoro di ingegneria (sotto il moniker di “dati prep”) e che genera anche il codice (in un proprietario di Microsoft lingua si chiama M) per farlo. Il nome di collisione è un peccato, ma speriamo che Microsoft rettificare.

Per quello che vale, Alimentazione BI flussi di dati utilizzare ADLS Gen2 deposito, dietro le quinte.

Spedizione dal magazzino

L’ultima rata in Microsoft set di dati della nuvola di annunci di oggi prevede di SQL Azure Magazzino di Dati SQL (DW) e, in misura minore, di Power BI. In due turni di test di benchmark effettuati da GigaOm Research (vedere la divulgazione alla fine di questo post), Azure DW è stato trovato per essere il 67 per cento più veloce di Amazon Redshift e fino a 14x più veloce di Google BigQuery. Microsoft inizierà una spinta importante intorno a questa news: tout, nel complesso, il rapporto prezzo/prestazioni vantaggio di public cloud provider di data warehouse rivali, in felice sintesi, come superando la concorrenza fino a 14x, pur essendo fino al 94% in meno.

59b66bb1-a2ae-4cbe-a351-d0cc066b80fe1.png

Prezzo/prestazioni di confronto di SQL DW, Redshift e BigQuery, basato su Gigaom parametri di riferimento.

Credito: Microsoft e Gigaom

Leggi anche: SQL Azure Data Warehouse “generazione 2”: Microsoft colpo su Amazon arco

Microsoft anche pitching la combinazione di prezzo/prestazioni efficienti SQL DW servizio con Alimentazione BI e due funzioni recentemente aggiunto all’ultimo: composito modelli e le aggregazioni. Insieme, queste due caratteristiche permettono di Alimentazione BI agli utenti di memorizzare i dati aggregati a livello locale in una Alimentazione BI modello, lasciando il più voluminoso dettaglio i dati in un archivio esterno. Per un dato modello di dati, Alimentazione BI utenti di scegliere tra i locali di “importare” esterno “DirectQuery” modalità, ma ora si può mescolare e abbinare. Questo rende Power BI Big Data-capace quando le funzioni sono attivate attraverso l’uso di un archivio esterno come SQL DW.

La generazione più giovane

Microsoft ha ora lanciato il “Gen2” iterazioni di Dati Lago di Archiviazione e Data Warehouse e “v2” iterazione dei Dati di Fabbrica. E con Alimentazione BI viene aggiornata ogni mese, che il prodotto è senza dubbio a circa Gen42 ora.

Leggi anche: Cortana Analytics: Microsoft cloud analytics prix fixe

Microsoft è all-in sul cloud, la nuvola è all-in con i dati, e il cloud è ormai maturo. Il risultato? In uno sforzo per vincere l’Impresa, i principali fornitori di cloud pubblici sono su di giri i loro servizi dati da raggiungere, superare la parità con i migliori locali di offerte. Che va non solo per la base, servizi di database, ma di data warehousing, business intelligence, data di ingegneria e Big Data analytics. Oggi segna l’inizio di Microsoft il prossimo grande capitolo che racconto epico.

Disclosure: io do i dati e analytics-concentrato analista di lavoro per Gigaom, ma io non sono stato coinvolto in SQL DW benchmark di lavoro.

Argomenti Correlati:

Cloud

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software