
En högnivåvy av datakällorna, både Microsoft och icke-Microsoft kan Azure Purview integreras i sin datakarta och katalog.
Kredit: Microsoft
Efter en nästan tio månader lång förhandsgranskning och år av haltning tillsammans med den understyrda Azure Data Catalog-tjänsten går Microsoft äntligen in i datastyrningens bästa sändningstid idag, med allmän tillgänglighet (GA) för Azure Purview. Bestående av både en underliggande datahanterings-/styrplattform och en ny datakatalogapplikation som körs på den, syftar Purview till att tillgodose företagsorganisationers dubbla behov av att hålla deras data upptäckbara och hantera dess användning i enlighet med dataskyddsbestämmelser i flera jurisdiktioner i hela jurisdiktionen i hela världen.
Läs också: Microsoft introducerar Azure Purview -datakatalog; tillkännager GA för Synapse Analytics
ZDNet pratade med Mike Flasko, Microsofts General Manager, Data Governance & amp; Sekretessplattform, för att förstå Azure Purviews möjligheter, tekniska underlag, prisstruktur och färdplan mer exakt. Flasko gav omfattande detaljer om alla dessa aspekter; han beskrev också Azure Purviews arkitektur ganska bra, och hur det påverkar tjänsten i praktiska termer.
Purview's not parochial
Purview integrerar en mängd Microsoft-produkter och tjänster, både i molnet och lokalt. Dessa inkluderar Azure Synapse Analytics, Azure SQL, Azure Data Factory, Power BI, SQL Server och till och med Microsoft Information Protection. Men Purview har också sportkontakter för egenskaper som inte är Microsoft, som Amazon Web Services 'S3-lagringstjänst, Snowflake och Oracle Database.
Läs också: På Microsoft Ignite, utökad räckvidd för Azure ML & amp; Purview, Power BI Premium
Purview hade 36 kontakter när ZDNet pratade med Microsoft; och Flasko säger att nya kontakter kommer att släppas varje månad. Idag, tillsammans med Azure Purview GA själv, tillkännager Microsoft också GA för ovan nämnda AWS S3-stöd, tillsammans med den offentliga förhandsvisningen av datasökning av Erwin, IBM DB2, Salesforce, Google BigQuery, Looker och Cassandra. < /p>
Modulär arkitektur
Till skillnad från vissa datakatalogplattformar som tätt kopplar ihop funktioner som en företagsordlista och datauppsättningsannotering med anslutning till och skanning av datakällor, tar Azure Purview ett mer modulärt tillvägagångssätt. Purview -tjänsten kan skanna datakällor, samla in sina metadata, upptäcka släktinformation och klassificera känslig data automatiskt, fylla ut vad Microsoft kallar en “datakarta” (och vad andra datakatalogleverantörer kan kalla ett kunskapsdiagram). Datakartan kan byggas, nås och underhållas via ett användargränssnitt eller via applikationsprogrammeringsgränssnittet (API) som definieras av Apache Atlas -projektet med öppen källkod. Azure Purview ger också förlängningspunkter för skapandet av nya datakällanslutningar och nya dataklassificerare.
Microsoft kan också skriva program som körs på plattformen, vilket är exakt hur Microsoft har implementerat Azure Purview Data Catalog. Andra applikationer och funktioner kommer att komma från Microsoft för att implementera andra datahanteringsfunktioner (datakvalitetsbedömning, implementerad som en valfri skanningsprocess, är ett specifikt exempel som Flasko nämnde). Tredjeparts oberoende mjukvaruleverantörer kan integrera med Purview-tjänsten på ett liknande sätt. Som ett exempel på detta har Microsoft samarbetat med Alpharetta, GA-baserade Profisee för att tillhandahålla funktioner för master data management (MDM) på Azure Purview-plattformen.
Detta är ett passande partnerskap, eftersom olika medlemmar i Profisees ledningsgrupp (inklusive dess VD, Ian Ahern) tidigare drev Stratature, ett företag som Microsoft förvärvade 2007, vars kärnteknik blev SQL Server Master Data Services. Det verkar, precis som Azure Data Factory har blivit den moderna, molnfödda efterföljaren till SQL Server Integration Services (SSIS), att Azure Purview, antingen direkt eller indirekt, kommer att fungera som en plattform för moderna efterträdare till SQL Server Master Data Services (MDS) och Data Quality Services (DQS).
Läs också: Azure Data Factory v2: Praktisk översikt
Prissättning och tillgänglighet
På grund av Purviews modulära, flerhuvudiga arkitektur kommer de som planerar sina utgifter runt plattformen att ha lite beräkning att göra. Enligt Microsofts prissida för Azure Purview, beräknas prissättning av Azure Purview i huvudsak till kostnaden för datakartan + kostnad för skanning + kostnad för resursuppsättning.
Resursuppsättningen är, enligt prissidan, “en inbyggd funktion i datakartan som används för att optimera lagring och sökning av datatillgångar associerade med partitionerade filer i datasjöar.” Prissättning för resursuppsättningar och skanningsoperationer baseras på vCore -timmar som används, även om priset per vCore -timme och antalet vCores som är inblandade i resursuppsättningar och skanningsoperationer skiljer sig åt.
Den faktiska beräkningen som är involverad i att köra datakartan faktureras av “kapacitetsenheter” som används, där en sådan enhet tjänar i en obegränsad kapacitet över 2 GB data. Dessa kapacitetsenheter faktureras alltid (i stället för genom användning), och faktureringen fortsätter tills och om inte datakartan rivs. Användningen av Azure Purview Catalog -applikationen är under tiden gratis.
Azure Purview är i allmänhet tillgängligt omedelbart med tillgänglighet i 14 Azure -regioner. Detta inkluderar tre nya regioner – West US 2, West Central US & amp; Nordeuropa – som inte var en del av förhandsvisningen. För dem som vill lära sig mer om Purview, inklusive dess senaste funktioner, kommer Microsoft att publicera veckovisa bloggar under en begränsad tid, med start den 6 oktober 2021, på Azure Purview TechCommunity -webbplatsen.
Relaterade ämnen:
Big Data Analytics Innovation CXO Artificial Intelligence Enterprise Software Storage