
En oversikt over datakildene på høyt nivå, både Microsoft og ikke-Microsoft, kan Azure Purview integreres i datakartet og katalogen.
Kreditt: Microsoft
Etter en nesten ti måneder lang forhåndsvisning og mange års halting sammen med den underdrevne Azure Data Catalog-tjenesten, går Microsoft endelig inn i datastyringens beste sendetid i dag, med generell tilgjengelighet (GA) for Azure Purview. Bestående av både en underliggende datahåndterings-/styringsplattform og en ny datakatalogapplikasjon som kjører på den, har Purview som mål å betjene bedriftsorganisasjoners tvillingebehov for å holde dataene deres oppdagbare og administrere bruken i samsvar med databeskyttelsesforskriftene i flere jurisdiksjoner i hele jurisdiksjonen. verden.
Les også: Microsoft introduserer Azure Purview -datakatalog; kunngjør GA for Synapse Analytics
ZDNet snakket med Mike Flasko, Microsofts daglige leder, Data Governance & amp; Personvernplattform, for å forstå Azure Purviews evner, teknologiske underlag, prisstruktur og veikart mer presist. Flasko ga omfattende detaljer om alle disse fasettene; han beskrev også Azure Purviews arkitektur ganske bra, og hvordan det påvirker tjenesten praktisk.
Purview er ikke parochial
Purview integrerer en rekke Microsoft-produkter og -tjenester, både i nettskyen og lokalt. Disse inkluderer Azure Synapse Analytics, Azure SQL, Azure Data Factory, Power BI, SQL Server og til og med Microsoft Information Protection. Men Purview har også sportskontakter for eiendommer som ikke er Microsoft, som Amazon Web Services 'S3-lagringstjeneste, Snowflake og Oracle Database.
Les også: På Microsoft Ignite utvider rekkevidden for Azure ML & amp; Purview, Power BI Premium
Purview hadde 36 kontakter da ZDNet snakket med Microsoft; og Flasko sier at nye kontakter vil bli utgitt hver måned. I dag, sammen med selve Azure Purview GA, kunngjør Microsoft også GA for ovennevnte AWS S3-støtte, sammen med den offentlige forhåndsvisningen av dataskanning av Erwin, IBM DB2, Salesforce, Google BigQuery, Looker og Cassandra. < /p>
Modulær arkitektur
I motsetning til noen datakatalogplattformer som tett kobler sammen funksjoner som en virksomhetsordliste og datasettkommentarer med tilkobling til og skanning av datakilder, bruker Azure Purview en mer modulær tilnærming. Purview -tjenesten kan skanne datakilder, samle metadata, oppdage slektsinformasjon og klassifisere sensitive data på en automatisert basis, og fylle ut det Microsoft kaller et “datakart” (og hva andre datakatalogleverandører kan kalle en kunnskapsgraf). Datakartet kan bygges, åpnes og vedlikeholdes via et brukergrensesnitt eller via applikasjonsprogrammeringsgrensesnittet (API) definert av Apache Atlas -prosjektet med åpen kildekode. Azure Purview gir også utvidelsespunkter for opprettelse av nye datakildekoblinger og nye dataklassifiseringer.
Microsoft kan også skrive applikasjoner som kjører på plattformen, og det er akkurat slik Microsoft har implementert Azure Purview Data Catalog. Andre applikasjoner og muligheter vil komme fra Microsoft for å implementere andre datahåndteringsfunksjoner (datakvalitetsvurdering, implementert som en valgfri skanneprosess, er et spesifikt eksempel Flasko nevnte). Tredjeparts uavhengige programvareleverandører kan integrere seg med Purview-tjenesten på en lignende måte. Som et eksempel på dette har Microsoft inngått samarbeid med Alpharetta, GA-basert Profisee for å tilby master data management (MDM) -funksjoner på Azure Purview-plattformen.
Dette er et passende partnerskap, ettersom forskjellige medlemmer av Profisees lederteam (inkludert administrerende direktør, Ian Ahern) tidligere drev Stratature, et selskap Microsoft kjøpte i 2007, hvor kjerneteknologien ble SQL Server Master Data Services. Det ser ut til, akkurat som Azure Data Factory har blitt den moderne, cloud-native etterfølgeren til SQL Server Integration Services (SSIS), at Azure Purview, enten direkte eller indirekte, vil tjene som en plattform for moderne etterfølgere til SQL Server Master Data Services (MDS) og Data Quality Services (DQS).
Les også: Azure Data Factory v2: Praktisk oversikt
Priser og tilgjengelighet
På grunn av Purviews modulære, flerhodede arkitektur, vil de som planlegger sine utgifter rundt plattformen ha noen beregninger å gjøre. Ifølge Microsofts Azure Purview -prisside, beregner Azure Purview -priser seg i hovedsak til kostnaden for datakartet + kostnad for skanning + kostnad for ressurssett.
Ressurssettet er, i henhold til prissiden, “en innebygd funksjon i datakartet som brukes til å optimalisere lagring og søk av dataressurser knyttet til partisjonerte filer i datasjøer.” Prissetting for ressurssett- og skanningsoperasjoner er basert på vCore -timer som brukes, selv om prisen per vCore -time og antall vCores som er involvert i ressurssett- og skanningsoperasjoner er forskjellige.
Den faktiske beregningen som er involvert i å kjøre datakartet blir fakturert av “kapasitetsenheter” som brukes, hvor en slik enhet tjener i en ubegrenset kapasitet over 2 GB data. Disse kapasitetsenhetene faktureres alltid (i stedet for etter bruk), og fakturering vedvarer til og med mindre datakartet blir revet ned. I mellomtiden er bruk av Azure Purview Catalog -applikasjonen gratis.
Azure Purview er vanligvis tilgjengelig umiddelbart, med tilgjengelighet i 14 Azure -regioner. Dette inkluderer tre nye regioner – West US 2, West Central US & amp; Nord -Europa – som ikke var en del av forhåndsvisningen. For de som ønsker å lære om Purview, inkludert de nyeste funksjonene, legger Microsoft ut ukentlige blogger for en begrenset periode, fra og med 6. oktober 2021, på Azure Purview TechCommunity -nettstedet.
Relaterte emner:
Big Data Analytics Innovation CXO Artificial Intelligence Enterprise Software Storage