De gegevens van Microsoft aankondigingen, en wat ze betekenen

0
215

Vorige week, Microsoft hield haar jaarlijkse Connect() event in New York City, op een evenement ruimte aan de monding van de Holland Tunnel. Connect() de neiging te worden gericht op het Visual Studio en de ontwikkeling van de toepassing van stapel. Maar net als de Holland Tunnel joins in een hip deel van Manhattan en Jersey City, NJ, Connect() elkaar verbonden, de dev stapel aankondigingen met een hoop aankondigingen rond het Microsoft-Platform.

Microsoft had twee grote aankondigingen rondom SQL Server, misschien wel de Data Platform component gebonden meest nauw aan bij de ontwikkelaar wereld. Maar het had ook aankondigingen in de wereld van Big Data en analytics, specifiek rond Azure Data Meer; R-Server, HDInsight en Apache Kafka.

Lees ook: Waarom Microsoft moet SQL Server op Linux
Lees ook: Microsoft SQL Server voor Linux, Windows hit public preview
Lees ook: Microsoft SQL Server Volgende: Wat is onder de dekens

Let ‘ s get relationele
Laten we beginnen met de spullen met betrekking tot SQL Server, mijn Microsoft data eerste liefde. En als ik hield het al eerder, er is een nog grotere aantrekkingskracht nu. De redenen: (1) de eerste versie van het product te draaien op Linux is nu in de public preview-als onderdeel van SQL Server “vNext” Community Technology Preview 1 CTP (1) en (2) bijna alle leuke features van het product die exclusief voor de Enterprise-Editie zijn nu, met de release van SQL Server 2016 Service Pack 1 (SP1), verkrijgbaar in elke editie, waaronder Standaard -, Web -, Express-en, met enkele voetnoten, zelfs in LocalDB, de applicatie-embedded versie van het product.

Als iemand die betrokken was bij het begin van het private voorbeeld van SQL Server op Linux, ik ben echt blij dat iedereen kan controleren nu. Terwijl het product bevat alleen de kern relationele engine, en niet breder onderdelen, zoals Reporting Services, Analysis Services of Integration Services, is het toch een volwaardige implementatie van het product, en kan zowel ‘ op het metaal, of in een Docker container. Het is compatibel met Suse, Ubuntu en Red Hat Enterprise Linux (RHEL) verdelingen.

Sluit de Ramen
Het meest opmerkelijke aan SQL Server op Linux is hoe, als het eenmaal geïnstalleerd is en werkt, is niet opmerkelijk. In andere woorden, er zijn weliswaar enkele Linux commando-regel gereedschap voor het product, die duidelijk zijn unieke, in interactie met de server vanuit een toepassing, BI-tool of zelfs een Windows-hulpprogramma zoals SQL Server Management Studio is praktisch niet te onderscheiden is van het werken met Windows-versie. Het is bijna een in de steek gelaten.

Maar het grote verschil is dat ontwikkelaars die zich richt op Linux servers kan werken met SQL Server nu. En zelfs de ontwikkelaars van het gebruik van Macs kunnen uitvoeren van het lokaal, zonder een NETWERK of Internet verbinding, door het uitvoeren van het in het Koppelvenster container. Dit maakt SQL Server meer concurrerend met Oracle, dat is zeker. Maar het maakt het ook meer concurrerend met open source relationele databases zoals MySQL en PostgreSQL.

Je krijgt columnstore, en je krijgt in het geheugen, en je krijgt PolyBase!
Natuurlijk, SQL Server, zelfs op Linux, is niet open source. Maar de gratis versies bestaan. Specifiek, SQL Server Express en LocalDB zijn zowel gratis producten. Terwijl ze leggen geheugen beperkingen en andere beperkingen, ze werken goed waar kleinere databases nodig zijn. Het probleem met deze edities, en zelfs hun oudere, betaald broers en zussen zoals Web Edition en Standard Edition, is dat Microsoft heeft de hoogte van de nieuwste doorbraak SQL Server-technologieën.

Coole features zoals columnstore indexen (die overgaat SQL Server in een column store database, waardoor het datawarehouse, data mart en hybride transactionele-analytics implementaties), geheugen-geoptimaliseerd tabellen (een in-memory transactionele database technologie) en PolyBase (waarbij data in Hadoop en Azure Blob Storage worden opgevraagd en sloot zich alsof het zich in SQL Server-tabellen) zijn grenzen aan niet-zakelijke klanten. Dit heeft geremd hun goedkeuring onder ontwikkelaars, Onafhankelijke softwareleveranciers (Isv ‘ s — die nodig zijn voor het bouwen van hun applicaties te werken op de Standaard Editie voor de klanten die het hebben) en, bij uitbreiding, voor het gehele ecosysteem.

Dat is een ding van het verleden, nu al, met Microsoft ‘ s aankondiging van de general availability (GA) van SQL 2016 SP1 vorige week, vrijwel alle functies zijn beschikbaar in alle edities. Er zijn een paar uitzonderingen? Ja, maar ze zijn logisch, gebaseerd op hoe deze edities worden ingezet. En Microsoft is ook erg duidelijk en transparant te zijn over de uitzonderingen, samenvatten hen in de blog post op SP1 die ik gekoppeld heb aan in het derde lid van dit bericht.

Microsoft harten ontwikkelaars
Zodat we kunnen beginnen te zien een pad waar ontwikkelaars op hun Mac-en Linux-servers, die gewend is te werken met een gratis, open source tools, kan ook de code aan de hand van SQL Server en de meest geavanceerde functies, zonder dat kost hen geld, en zonder een machine (zelfs een virtuele) met Windows. We zijn er nog niet, maar als SQL Server vNext op Linux, en de functie/licensing beleid in SQL 2016 SP1 convergeren, we ‘ ll be damned sluiten.

Als een oude Microsoft-ecosysteem professional, dat geeft me hoop. In een tijd waarin het werken met gegevens, heeft de betekenis gekregen van het werken met Linux en open source, dit is een goede draai van gebeurtenissen.

“R met je is echt een Kafkaiaanse ervaring…”
Een even positieve ontwikkeling is opgetreden bij Microsoft besloten om een Linux-versie van zijn cloud-gebaseerde Hadoop distributie, HDInsight. Dit betekende dat de bedrijven in het Hadoop ecosysteem, vrijwel allen (met inbegrip van mijn werkgever, Datameer) zijn Linux-gericht, kunnen partner en integreren met HDInsight.

Dit heeft geholpen HDInsight uitgegroeid tot een volwaardige Hadoop distributie, het aanbieden van specialistische cluster vormen niet alleen voor generieke Hadoop werk, maar ook voor het werken met Apache HBase, Storm en Vonk. En, net vorige week aangekondigd, een nieuwe cluster-type voor het werken met streaming data-georiënteerde Apache Kafka, is in public preview.

En wanneer Microsoft verworven Revolutie Analytics, die was uitgegroeid tot de belangrijkste commerciële entiteit achter de open source-R programmeertaal voor statistieken en machine learning, dat was goed ook. Dat bedrijf Revolutie R Enterprise (RRE) product, nu verkocht als Microsoft-R-Server, was opmerkelijk in zijn vermogen om te draaien op een server, of de schaal over de hele clusters, uitgevoerd in een gedistribueerde, in-database mode, in plaats van stand-alone op een lokale PC of Mac.

SQL Server 2016 omvat de integratie van de R-Server technologie in de vorm van SQL Server O Services. En terwijl dat nog geen deel uit van SQL Server op Linux, een andere integratie is een Linux-gebaseerd: R-Server voor HDInsight, die geïntegreerd is met Apache Vonk, die op HDInsight. Dat product was in de preview voor enige tijd, en de laatste week ging in GA.

De GA-versie is afgestemd op het werken met Spark 2.0, kunnen toegang krijgen tot gegevens die zijn opgeslagen in Apache Bijenkorf of Parket indeling in HDFS direct, en kan ook toegang krijgen tot gegevens in Microsoft ‘ s HDFS-compatibele opslag service genaamd Azure Gegevens Meer Opslaan (ADL).

Gegevens Meer en meer
De laatste, hoewel gebaseerd op Azure Blob Storage, zorgt voor een nog meer robuuste fouttolerantie en heeft geen limiet op bestandsgrootte. Het heeft ook weg GA, net als zijn metgezel query service, Azure Data Lake Analytics (ADLA). De combinatie van ADL en ADLA laten doen met Big Data te werken met behulp van U-SQL, SQL-als query taal die is uitbreidbaar met behulp van Microsoft .NET en C#. Plus, ADLA-taken worden uitgevoerd op de vraag, eerder dan die een specifiek cluster, dat brengt een Platform-as-a-Service gevoeligheid voor Hadoop, waarop ADLA loopt.

Dat is ongeveer alles wat er is, maar het is heel veel. Vanaf SQL Server relationele technologie te R, Hadoop, Vonk, Kafka en diverse integraties tussen hen, op zowel Windows als op Linux, Microsoft, als er niets anders, heeft gegevens en analyses passie, big time. Wanneer je dingen toevoegt zoals Cognitieve Diensten en de Kracht van BI op de top van dit alles, heeft Microsoft een uitgestrekte, enorme muur van data-technologie die is geïntegreerd, open en cross-platform.