Azure Purview -datastyringstjeneste leder til GA

0
106

 Andrew Brust

Af Andrew Brust for Big on Data | 28. september 2021 | Emne: Datahåndtering

azure-purview-slide.png

En visning på højt niveau af datakilderne, både Microsoft og ikke-Microsoft, kan Azure Purview integreres i dets datakort og katalog.

Kredit: Microsoft

Efter en næsten ti måneder lang forhåndsvisning og mange års haltning sammen med den underdrevne Azure Data Catalog-tjeneste, går Microsoft endelig ind i datastyringens bedste sendetid i dag med generel tilgængelighed (GA) af Azure Purview. Bestående af både en underliggende datahåndterings-/styringsplatform og en ny datakatalogapplikation, der kører på den, har Purview til formål at servicere virksomhedsorganisationers to behov for at holde deres data opdagelige og styre deres anvendelse i overensstemmelse med databeskyttelsesregler i flere jurisdiktioner i hele jurisdiktionen i hele verden.

Læs også: Microsoft introducerer Azure Purview -datakatalog; annoncerer GA for Synapse Analytics

ZDNet talte med Mike Flasko, Microsofts General Manager, Data Governance & amp; Privacy Platform, for at forstå Azure Purview's muligheder, teknologiske underlag, prisstruktur og køreplan mere præcist. Flasko leverede omfattende detaljer om alle disse facetter; han beskrev også Azure Purviews arkitektur ganske godt, og hvordan det påvirker tjenesten rent praktisk.

Purview's not parochial

Purview integrerer en lang række Microsoft-produkter og -tjenester, både i skyen og lokalt. Disse inkluderer Azure Synapse Analytics, Azure SQL, Azure Data Factory, Power BI, SQL Server og endda Microsoft Information Protection. Men Purview har også sportsstik til ejendomme, der ikke er Microsoft, som Amazon Web Services 'S3-lagertjeneste, Snowflake og Oracle Database.

Læs også: Hos Microsoft Ignite udvider rækkevidden til Azure ML & amp; Purview, Power BI Premium

Purview havde 36 stik, da ZDNet talte med Microsoft; og Flasko siger, at nye stik vil blive frigivet hver måned. I dag, sammen med selve Azure Purview GA, annoncerer Microsoft også GA for ovennævnte AWS S3-support sammen med den offentlige forhåndsvisning af datascanning af Erwin, IBM DB2, Salesforce, Google BigQuery, Looker og Cassandra. < /p>

Modulær arkitektur

I modsætning til nogle datakatalogplatforme, der tæt forbinder funktioner som en virksomheds ordliste og datasæt -annotering med forbindelse til og scanning af datakilder, tager Azure Purview en mere modulær tilgang. Purview -tjenesten kan scanne datakilder, indsamle deres metadata, registrere slægtsoplysninger og klassificere følsomme data på et automatisk grundlag, og udfylde det, Microsoft kalder et “datakort” (og hvad andre datakatalogleverandører kan kalde en videngraf). Datakortet kan bygges, tilgås og vedligeholdes via en brugergrænseflade eller via applikationsprogrammeringsgrænsefladen (API) defineret af Apache Atlas -projektet med open source. Azure Purview giver også udvidelsespunkter til oprettelse af nye datakildestik og nye dataklassifikatorer.

Microsoft kan også skrive applikationer, der kører på platformen, hvilket er præcis, hvordan Microsoft har implementeret Azure Purview Data Catalog. Andre applikationer og funktioner kommer fra Microsoft til implementering af andre datastyringsfunktioner (vurdering af datakvalitet, implementeret som en valgfri scanningsproces, er et specifikt eksempel, Flasko nævnte). Tredjeparts uafhængige softwareleverandører kan integreres med Purview-tjenesten på en lignende måde. Som et eksempel på dette har Microsoft indgået et partnerskab med Alpharetta, GA-baserede Profisee for at levere master data management (MDM) -funktioner på Azure Purview-platformen.

Dette er et passende partnerskab, da forskellige medlemmer af Profisee's lederteam (herunder dets administrerende direktør, Ian Ahern) tidligere drev Stratature, et firma Microsoft erhvervede i 2007, hvis kerneteknologi blev SQL Server Master Data Services. Det ser ud til, ligesom Azure Data Factory er blevet den moderne, cloud-native efterfølger til SQL Server Integration Services (SSIS), at Azure Purview, enten direkte eller indirekte, vil tjene som en platform for moderne efterfølgere til SQL Server Master Data Services (MDS) og Data Quality Services (DQS).

Læs også: Azure Data Factory v2: Hands-on oversigt

Prissætning og tilgængelighed

På grund af Purview's modulære, flerhovedede arkitektur vil de, der planlægger deres udgifter omkring platformen, have nogle beregninger at gøre. Ifølge Microsofts Azure Purview -prisside, beregner Azure Purview -prissætningen i det væsentlige sig til omkostningerne ved datakortet + omkostninger til scanning + omkostninger ved ressourcessæt.

Ressourcesættet er ifølge prissiden “en indbygget funktion i datakortet, der bruges til at optimere opbevaring og søgning efter dataaktiver, der er forbundet med partitionerede filer i datasøer.” Prisfastsættelse for ressourcesæt og scanningsoperationer er baseret på vCore -timer, selvom prisen pr. VCore -time og antallet af vCores, der er involveret i ressource -sæt- og scanningsoperationer, er forskellige.

Den faktiske beregning, der er involveret i at køre datakortet, faktureres af “anvendte kapacitetsenheder”, hvor en sådan enhed tjener i en ubegrænset kapacitet over 2 GB data. Disse kapacitetsenheder faktureres altid (snarere end ved brug), og fakturering fortsætter, indtil og medmindre datakortet er revet ned. Anvendelse af Azure Purview Catalog -applikationen er i mellemtiden gratis.

Azure Purview er generelt tilgængelig med det samme med tilgængelighed i 14 Azure -regioner. Dette omfatter tre nye regioner – West US 2, West Central US & amp; Nordeuropa – det var ikke en del af forhåndsvisningen. For dem, der ønsker at lære mere om Purview, herunder dets nyeste funktioner, vil Microsoft offentliggøre ugentlige blogs i en begrænset periode fra den 6. oktober 2021 på Azure Purview TechCommunity -webstedet.

Relaterede emner:

Big Data Analytics Innovation CXO Artificial Intelligence Enterprise Software Storage  Andrew Brust

Af Andrew Brust for Big on Data | 28. september 2021 | Emne: Datahåndtering