Microsofts data meddelanden, och vad de betyder

0
94

Förra veckan, Microsoft höll sin årliga Connect() event i New York på ett evenemang utrymme precis vid mynningen av Holland Tunnel. Connect() tenderar att vara inriktade på Visual Studio och applikationsutveckling stack. Men precis som Holland Tunnel som ansluter sig till ett hip delen av Manhattan till Jersey City, NJ, Connect() bundna tillsammans dev stack meddelanden med ett gäng meddelanden runt om i Microsofts dataplattform.

Microsoft hade två stora tillkännagivanden kring SQL Server, utan tvekan den Data som Plattform är en komponent bunden närmast till utvecklare världen. Men det hade också meddelanden i världar av Big Data och analyser, särskilt runt Azure-för synkronisering av Data Sjön; R Server, HDInsight och Apache Kafka.

Läs också: Varför måste Microsoft SQL Server på Linux
Läs också: Microsoft SQL Server Nästa för Linux, Windows hit public preview
Läs också: Microsoft SQL Server Nästa: Vad är det under täcket

Låt oss få relationell
Låt oss börja med de saker som hör till SQL Server, Microsoft data första kärlek. Och om jag älskade det förut, det är en ännu större attraktion nu. Den skäl: (1) den första versionen av produkten för att köra på Linux är nu i public preview som en del av SQL Server “vNext” Community Technology Preview 1 (CTP 1) och (2) nästan alla de häftiga funktioner i produkten som var exklusiva till Enterprise Edition är nu, i och med utgivningen av SQL Server 2016 Service Pack 1 (SP1), finns i varje utgåva, inklusive Standard, Web, Snabb och med några fotnoter, även i LocalDB de program som är inbäddade versionen av produkten.

Som någon som var med tidigt i den privata förhandsvisning av SQL Server för Linux, jag är verkligen glad att alla kan kolla upp det nu. Medan produkten innehåller endast de grundläggande relationella motorn, och inte bredare komponenter som Reporting Services, Analysis Services och Integration Services, är det ändå ett fullfjädrat genomförandet av produkt, och kan köras både “on metal” eller i ett Docker behållare. Det är kompatibel med Suse, Ubuntu och Red Hat Enterprise Linux (RHEL) fördelningar.

Stäng Fönster
Det mest anmärkningsvärda sak om SQL Server på Linux är hur, när det är installerat och fungerar, det är inte märkligt alls. Med andra ord, även om det finns vissa Linux kommandorad verktyg för den produkt som är helt klart unik, att interagera med servern från en ansökan, BI-verktyg eller till och med en Windows-baserat verktyg som SQL Server Management Studio, är praktiskt taget omöjlig att skilja från att arbeta vitt Windows-versionen. Det är nästan en låt ned.

Men den stora skillnaden är att utvecklare som är inriktade på Linux-servrar kan arbeta med SQL Server nu. Och även utvecklare som använder Mac kan köra den lokalt, utan en LAN-eller Internet-anslutning, genom att köra det i en Docker behållare. Detta gör SQL Server mer konkurrenskraftiga med Oracle, för att vara säker. Men det gör det också mer konkurrenskraftiga med öppen källkod relationella databaser som MySQL och PostgreSQL.

Du får columnstore, och du får i minnet, och du får PolyBase!
Naturligtvis, SQL Sever, även på Linux, är inte öppen källkod. Men gratis versioner finns. Specifikt, SQL Server Express och LocalDB är både gratis produkter. Samtidigt som de ställer minne restriktioner och andra begränsningar, de fungerar bra där mindre databaser behövs. Problemet med dessa utgåvor, och även deras äldre, betalas syskon som Web Edition och Standard Edition, är att Microsoft har hållit de flesta av sina senaste genombrott SQL Server-teknik ur dem.

Coola funktioner som columnstore index (som visar SQL-Server i en kolumn lagra databasen, så datalager, data mart och hybrid affärsbeslut-analytics-implementationer), minne-optimerad tabeller (en i minnet affärsbeslut databas teknik) och PolyBase (vilket gör att data i Hadoop och Azure Blob Storage efterfrågas och gick som om det var belägna i SQL Server-tabeller) har varit tabu att icke-Enterprise-kunder. Detta har hämmat deras antagande bland utvecklare, Oberoende programleverantörer (Isv: er — som behöver bygga upp sina program för att arbeta på Standard Edition för de kunder som har det), och i förlängningen hela ekosystem.

Det är en sak av det förflutna nu dock, med Microsoft meddelar allmänna tillgänglighet (GA) av SQL 2016 SP1 förra veckan, i stort sett alla funktioner är tillgängliga i alla versioner. Finns det några undantag? Ja, men de är logiskt, baserat på hur dessa utgåvor är utplacerade. Och Microsoft är också mycket enkel och transparent om undantag, sammanfatta dem i bloggen SP1, som jag länkade till i det tredje stycket i det här inlägget.

Microsoft hjärtan utvecklare
Så att vi kan börja se på en väg där utvecklare på deras Mac-och Linux-servrar, som används för att arbeta med gratis, open-source verktyg, kan också koden mot SQL Server och den mest avancerade funktioner, utan att det kostar dem pengar, och utan att behöva en maskin (även virtuella) kör Windows. Vi är inte där ännu, men när SQL Server vNext på Linux, och har/licensiering politik i SQL 2016 SP1 konvergerar, vi ska vara förbannat nära.

Som en longtime Microsofts ekosystem professionella, som ger mig optimism. I en ålder när de arbetar med uppgifter som har kommit att betyda att arbeta med Linux och öppen källkod, detta är en bra vändning.

“R med du är verkligen en Kafkaliknande erfarenhet…”
En liknande positiv utveckling skett när Microsoft bestämde sig för att släppa en Linux-version av sitt molnbaserade Hadoop distribution, HDInsight. Det innebar att företag i Hadoop ekosystem, så gott som alla (inklusive min arbetsgivare, Datameer) är Linux-fokuserad, kan partner och integrera med HDInsight.

Detta har bidragit till att HDInsight bli en fullfjädrad Hadoop distribution, som erbjuder specialiserade kluster typer inte bara för generiska Hadoop arbete, men också för att arbeta med Apache HBase, Storm och Gnista. Och, bara meddelade i förra veckan, ett nytt kluster för att arbeta med strömmande data-orienterad Apache Kafka, är i public preview.

Och när Microsoft köpte Revolution Analytics, som hade blivit den huvudsakliga kommersiella enhet bakom open source R programmeringsspråk för statistik och maskininlärning, som var bra också. Att bolagets Revolution R Enterprise (RRE) produkt som nu säljs som Microsoft R Server, var anmärkningsvärt i dess förmåga att köras på en server, eller skala över hela hopar, som körs i en distribuerad i-databasen läge, snarare än att köra fristående på en lokal PC eller Mac.

SQL Server 2016 omfattar integration av R-Server teknologi i form av SQL Server-R-Tjänster. Och medan det ännu inte är en del av SQL Server på Linux, en annan integration är Linux-baserad: R Server för HDInsight, som är integrerad med Apache Gnista, som körs på HDInsight. Denna produkt hade varit i förhandsgranska för lite tid, och förra veckan gick i GA.

GA-versionen är inställd för att arbeta med Spark 2.0, kan komma åt data som lagras i Apache Kupan eller Parkettgolv format i HDFS direkt, och kan också komma åt data i Microsoft HDFS-kompatibel lagringsenhet som kallas Azure-för synkronisering av Data Sjön Store (ADLS).

Data Sjön, och mer
Den senare, men baseras på Azure Blob Storage, ger ännu mer stabil feltolerans och har ingen begränsning på filstorlekar. Det har också gått GA, som har sina följeslagare frågetjänst, Azure Data Sjön Analytics (ADLA). Kombinationen av ADLS och ADLA låter dig göra Big Data att arbeta med U-SQL, SQL som frågespråk som är utbyggbar med hjälp av Microsoft .NET och C#. Plus, ADLA jobb är att köra på efterfrågan, snarare än att kräva en särskild kluster, vilket ger en Plattform som en Tjänst känslighet för Hadoop, som ADLA går.

Det är ungefär allt som finns, men det är en hel del. Från SQL Server-relationsdatabas teknik till R, Hadoop, Spark, Kafka och olika integrationer mellan dem, på både Windows och Linux, Microsoft, om inget annat, har data från analytics och passion, big time. När du lägger till saker som Kognitiv Services och Power BI på toppen av allt detta, Microsoft har ett spretigt, formidabel mur av data teknik som är integrerat, öppet och plattformsoberoende.