Microsoft maakt een hoop Azure data aankondigingen van vandaag, zowel van de gegevens meer en data warehouse fronten.
Ten eerste, Microsoft ‘ s Azure Data Explorer (ADX) product wordt uitgebracht in general availability (GA). ADX, die ik schreef over de afgelopen week, is een Big Data-opslag -, query-en visualisatie-platform, met een speciaal talent voor tijdreeksanalyse.
Lees ook: Snel, Microsoft partner op real-time analytics met Azure Data Explorer
De (gegevens meer) winkel is open voor het bedrijfsleven
Volgende, Azure Data Meer Opslag (ADLS) Gen2 hits GA vandaag ook. In tegenstelling tot de eerste versie van de ADL, de Gen2-release werkt als een uitbreiding van het Azure Blob Storage, maar lagen een echte hiërarchische bestandssysteem op de top van het, samen met de mogelijkheid om een willekeurig grote bestanden. Hiërarchische bestandssystemen hebben eerste klas ondersteuning voor de map structuren. Dat is van belang in van Big Data toepassingen waar de gegevens vaak gepartitioneerd als groepen van de reeks bestanden die worden afgescheiden door de map, waardoor map-niveau van activiteiten dat kan de behandeling van alle bestanden in een map als een eenheid van data.
Standard cloud object storage systemen blijven alle bestanden in een root-niveau van de container en maak de “illusie” van mappen door het inbedden van de namen van de directory in de metadata. De beschikbaarheid van ADL Gen2 zal wezen geeft Microsoft een twee-tiered storage oplossing tegen Amazon ‘ s S3. Terwijl Amazon ‘s one-size-fits-all’ – verhaal heeft het voordeel van eenvoud, ADL geeft Microsoft een grote Big Data-oplossing, en één die is gebaseerd op de object store technologie, in plaats van een volledig apart product.
In deze eerste release, ADLS Gen2 bestandssystemen gebrek aan compatibiliteit met Blob Storage-Api ‘ s, maar dat zal later worden toegevoegd. Plus, er is genoeg van de rechtstreekse steun voor Gen2, uit de poort. Bijvoorbeeld Apache Hadoop 3.2, uitgebracht in de laatste maand, biedt u directe steun voor ADLS Gen2. Verschillende Big Data ecosysteem van leveranciers, met inbegrip van Cloudera, Dremio en Arcadia Gegevens, hebben zich geëngageerd om de ADL. En in de Microsoft wereld, tal van data in de cloud diensten, met inbegrip van Azure Databricks, HDInsight, de Kracht van BI en Azure Data Factory, ondersteuning ADL Gen2 direct, ook.
Let ‘ s get visual
Het spreken van Azure Data Factory (ADI), dat dienst zal nu een visuele data flow-faciliteit, hebben in het openbaar preview. Terwijl ADI heeft enige tijd voorzien van een visual designer voor de muziek van het beheer van, de feitelijke gegevens engineering werk moest worden gedaan op externe scripts die de ADF kunnen draaien. Visuele data-stromen zal toestaan dat de gegevens engineering werkzaamheden zelf worden gedaan in een visual designer, die zal het genereren van de code achter de schermen.
Lees ook: Azure Data Factory v2: Hands-on overzicht
ADI visuele data-stromen moet niet worden verward met de dataflow functie in de Macht van de BI, de public preview voor die aangekondigd was drie maanden geleden. Power BI-datastromen zijn een cloud implementatie van de vennootschap de Macht Query-technologie, die ook zorgt voor visuele gegevens engineering (onder de naam van “data-prep”) te worden uitgevoerd en die ook genereert code (in een Microsoft-eigen programmeertaal genaamd M) om het te doen. De naam van de botsing is jammer, maar hopelijk Microsoft zal rectificeren.
Voor wat het waard is, Power BI-datastromen gebruik maken van ADL Gen2-opslag, achter de schermen.
Verzending vanaf het magazijn
De laatste aflevering in Microsoft set van data in de cloud aankondigingen vandaag gaat Azure SQL Data Warehouse (SQL-DW) en, in mindere mate, de Kracht van BI. In twee rondes van de benchmark-tests uitgevoerd door GigaOm Onderzoek (zie openbaring aan het eind van deze post), Azure DW bleek 67 procent sneller dan Amazon Roodverschuiving en tot 14x sneller dan Google BigQuery. Microsoft zal beginnen met een grote druk om dit nieuws en tout de algehele prijs/prestatie voordeel ten opzichte van de public cloud provider data warehouse rivalen, tellen deze beter te presteren dan de concurrentie door tot 14x, terwijl dat voor 94 procent goedkoper.

Prijs/prestatie vergelijking van SQL DW, Roodverschuiving en BigQuery, gebaseerd op Gigaom benchmarks.
Credit: Microsoft en Gigaom
Lees ook: Azure SQL datawarehouse “Gen 2”: Microsoft ‘s schot voor Amazon’ s bow
Microsoft zal ook worden pitching de combinatie van de prijs/prestatie-efficiënte SQL-DW-service met de Kracht van BI en twee functies onlangs toegevoegd aan het laatste: composiet modellen en aggregaties. Samen zorgen deze twee functies kunnen Power BI-gebruikers op te slaan geaggregeerde gegevens lokaal in een Power BI-model, terwijl de meer volumineuze detail-gegevens in een extern archief. Voor een gegeven model, Power BI-gebruikers gebruikt te hebben om te kiezen tussen de lokale “importeren” en extern “de directquery -” – modi, maar nu kunnen ze mixen en matchen. Dit maakt Macht BI-Big Data-staat, wanneer de functies zijn ingeschakeld door het gebruik van een externe winkel, zoals SQL-DW.
De jongere generatie
Microsoft heeft nu gestart met “Gen2” iteraties van Gegevens Meer Opslag-en Data Warehouse en een “v2” herhaling van Gegevens in de Fabriek. En met de Macht, BI ‘ s worden bijgewerkt elke maand dat het product is misschien wel op ongeveer Gen42 nu.
Lees ook: Cortana Analytics: Microsoft ‘ s cloud analytics prix fixe
Microsoft is all-in op de cloud de cloud is all-in op de data en de cloud is nu volwassen. Het resultaat? In een poging om te winnen van de Onderneming, de grote public cloud providers zijn toeren hun data diensten te bereiken, dan overschrijden, pariteit met de beste lokale aanbiedingen. Dat gaat niet alleen voor basic database diensten, maar data warehousing, BI, data engineering en Big Data analytics. Vandaag is de start van Microsoft ‘ s volgende grote hoofdstuk in dat verhaal.
Disclosure: ik zelf doe gegevens – en analytics-gericht analist werk voor Gigaom, maar ik was niet betrokken in de SQL-DW benchmark werk.
Verwante Onderwerpen:
Cloud
Digitale Transformatie
Robotica
Het Internet van Dingen
Innovatie
Enterprise Software