
Een overzicht op hoog niveau van de gegevensbronnen, zowel Microsoft als niet-Microsoft, Azure Purview kan worden geïntegreerd in de datamap en catalogus.
Credit: Microsoft
Na een bijna tien maanden durende preview en jaren van hinken samen met de ondermaatse Azure Data Catalog-service, betreedt Microsoft vandaag eindelijk de data governance prime time, met algemene beschikbaarheid (GA) van Azure Purview. Bestaande uit zowel een onderliggend datamanagement-/governanceplatform als een nieuwe datacatalogustoepassing die erop draait, streeft Purview ernaar om tegemoet te komen aan de dubbele behoeften van bedrijfsorganisaties om hun data vindbaar te houden en het gebruik ervan te beheren in overeenstemming met de gegevensbeschermingsregels in meerdere rechtsgebieden in de hele wereld. wereld.
Lees ook: Microsoft introduceert Azure Purview-gegevenscatalogus; kondigt aan dat GA van Synapse Analytics
ZDNet heeft gesproken met Mike Flasko, Microsoft's General Manager, Data Governance & Privacy Platform, om de mogelijkheden, technologische onderbouwing, prijsstructuur en roadmap van Azure Purview nauwkeuriger te begrijpen. Flasko gaf uitgebreide details over al deze facetten; hij beschreef ook de architectuur van Azure Purview vrij goed, en hoe dat de service in praktische termen beïnvloedt.
Purview is niet klein
Purview integreert een groot aantal Microsoft-producten en -services, zowel in de cloud als op locatie. Deze omvatten Azure Synapse Analytics, Azure SQL, Azure Data Factory, Power BI, SQL Server en zelfs Microsoft Information Protection. Maar Purview biedt ook sportconnectoren voor niet-Microsoft-eigendommen, zoals de S3-opslagservice van Amazon Web Services, Snowflake en Oracle Database.
Lees ook: Bij Microsoft Ignite, uitbreiding van het bereik voor Azure ML & Purview, Power BI Premium
Purview had 36 connectoren toen ZDNet met Microsoft sprak; en Flasko zegt dat er elke maand nieuwe connectoren zullen worden uitgebracht. Vandaag kondigt Microsoft, samen met de Azure Purview GA zelf, ook de GA aan van de bovengenoemde AWS S3-ondersteuning, samen met de openbare preview van het scannen van gegevens van Erwin, IBM DB2, Salesforce, Google BigQuery, Looker en Cassandra.< /p>
Modulaire architectuur
In tegenstelling tot sommige datacatalogusplatforms die mogelijkheden zoals een zakelijke woordenlijst en annotatie van gegevenssets nauw koppelen aan het verbinden met en scannen van gegevensbronnen, hanteert Azure Purview een meer modulaire aanpak. De Purview-service kan gegevensbronnen scannen, hun metagegevens verzamelen, afstammingsinformatie detecteren en gevoelige gegevens op geautomatiseerde basis classificeren, waarbij wordt ingevuld wat Microsoft een “gegevenskaart” noemt (en wat andere leveranciers van gegevenscatalogi een kennisgrafiek zouden kunnen noemen). De datamap kan worden gebouwd, geopend en onderhouden via een gebruikersinterface of via de Application Programming Interface (API) die is gedefinieerd door het open source Apache Atlas-project. Azure Purview biedt ook uitbreidingspunten voor het maken van nieuwe gegevensbronconnectoren en nieuwe gegevensclassificaties.
Microsoft kan ook applicaties schrijven die op het platform draaien, en dat is precies hoe Microsoft de Azure Purview Data Catalog heeft geïmplementeerd. Andere toepassingen en mogelijkheden zullen van Microsoft komen om andere gegevensbeheermogelijkheden te implementeren (beoordeling van gegevenskwaliteit, geïmplementeerd als een optioneel scanproces, is een specifiek voorbeeld dat Flasko noemde). Onafhankelijke softwareleveranciers van derden kunnen op een vergelijkbare manier integreren met de Purview-service. Als voorbeeld hiervan is Microsoft een samenwerking aangegaan met Alpharetta, GA-gebaseerde Profisee om master data management (MDM)-mogelijkheden te bieden op het Azure Purview-platform.
Dit is een passend partnerschap, aangezien verschillende leden van het leiderschapsteam van Profisee (inclusief de CEO, Ian Ahern) voorheen Stratature leidden, een bedrijf dat Microsoft in 2007 had overgenomen en waarvan de kerntechnologie SQL Server Master Data Services werd. Het lijkt erop dat, net zoals Azure Data Factory de moderne, cloud-native opvolger van SQL Server Integration Services (SSIS) is geworden, Azure Purview, direct of indirect, zal dienen als een platform voor moderne opvolgers van SQL Server Master Data Services (MDS) en Data Quality Services (DQS).
Lees ook: Azure Data Factory v2: praktisch overzicht
Prijzen en beschikbaarheid
Vanwege de modulaire, meerkoppige architectuur van Purview, zullen degenen die hun uitgaven rond het platform plannen, wat rekenwerk moeten doen. Volgens de Azure Purview-prijspagina van Microsoft komt het berekenen van Azure Purview-prijzen in wezen neer op de kosten van de gegevenskaart + scankosten + kosten van resourceset.
De bronnenset is, volgens de prijspagina, “een ingebouwde functie van de Data Map die wordt gebruikt om de opslag en het zoeken naar gegevensactiva die zijn gekoppeld aan gepartitioneerde bestanden in datameren” te optimaliseren. De prijzen voor resourceset- en scanbewerkingen zijn gebaseerd op de gebruikte vCore-uren, hoewel de prijs per vCore-uur en het aantal vCores dat betrokken is bij de resourceset- en scanbewerkingen verschillen.
De daadwerkelijke berekening die nodig is voor het uitvoeren van de Data Map wordt gefactureerd door de gebruikte “capaciteitseenheden”, waarbij een dergelijke eenheid een onbeperkte capaciteit heeft van meer dan 2 GB aan gegevens. Deze capaciteitseenheden worden gefactureerd op een altijd-aan-basis (in plaats van op basis van gebruik), en de facturering blijft bestaan totdat en tenzij de datamap wordt afgebroken. Het gebruik van de Azure Purview Catalog-toepassing is ondertussen gratis.
Azure Purview is over het algemeen per direct beschikbaar, met beschikbaarheid in 14 Azure-regio's. Dit omvat drie nieuwe regio's – West US 2, West Central US & Noord-Europa – die geen deel uitmaakten van de preview. Voor degenen die meer willen weten over Purview, inclusief de nieuwste functies, zal Microsoft vanaf 6 oktober 2021 voor een beperkte tijd wekelijkse blogs plaatsen op de Azure Purview TechCommunity-site.
Verwante onderwerpen:
Big Data Analytics Innovatie CXO Kunstmatige Intelligentie Enterprise Software Opslag