I sidste uge, Microsoft afholdt sin årlige Connect() event i New York, ved et arrangement plads lige ved mundingen af Holland-Tunnelen. Connect() har en tendens til at være fokuseret på Visual Studio og applikationsudvikling stak. Men lige som Holland Tunnel, som deltager i en hip del af Manhattan til Jersey City, NJ, opret Forbindelse (), der bindes sammen dev stak meddelelser med en masse meddelelser omkring Microsoft Data Platform.
Microsoft havde to store annonceringer omkring SQL Server, velsagtens Data Platform komponent knyttet mest til udvikleren verden. Men det havde også annonceringer i verdener af Big Data og analytics, specielt omkring Azure Data Søen; R Server, HDInsight og Apache Kafka.
Læs også: Hvorfor skal Microsoft SQL Server på Linux
Læs også: Microsoft SQL Server for Linux, Windows hit public preview
Læs også: Microsoft ‘ s SQL Server Næste: Hvad er der under dynen
Lad os få relationelle
Lad os starte med de ting, der hører til SQL Server, Microsoft data, første kærlighed. Og hvis jeg elskede det før, er der en endnu større attraktion nu. Årsager: (1) den første version af produktet for at køre på Linux, er nu i offentlig preview som en del af SQL Server “vNext” Community Technology Preview 1 (CTP 1) og (2) næsten alle de smarte funktioner i produktet, der var eksklusivt til Enterprise Edition er nu, med udgivelsen af SQL Server 2016 Service Pack 1 (SP1), der er tilgængelig i hver udgave, herunder Standard, Web, Hurtig og, med nogle fodnoter, selv i LocalDB, anvendelse-embedded version af produktet.
Som en person, der var involveret tidligt i den private uddrag af SQL Server på Linux, jeg er virkelig glad for at alle kan tjekke det ud nu. Mens produktet indeholder kun de centrale relationelle motor, og ikke bredere komponenter som Reporting Services, Analysis Services eller Integration Services, er det ikke desto mindre en fuldt udbygget gennemførelsen af produktet, og kan køre både “på metal,” eller i en Dokker container. Det er kompatibelt med Suse, Ubuntu og Red Hat Enterprise Linux (RHEL) – distributioner.
Luk Windows
Den mest bemærkelsesværdige ting om SQL Server på Linux er sådan, når det er installeret og fungerer, er det ikke bemærkelsesværdigt. Med andre ord, mens der ikke er nogle Linux command line tools for det produkt, som klart er unikt samspil med en server fra en ansøgning, BI-værktøj eller endda en Windows-baseret værktøj, som SQL Server Management Studio, er næsten umulig at skelne fra arbejde komitéens Windows-version. Det er næsten en lad ned.
Men den store forskel er, at udviklere, der er rettet mod Linux-servere kan arbejde med SQL Server nu. Og selv udviklere, der bruger Mac-computere kan køre det lokalt, uden et LAN eller Internet-forbindelse, ved at køre det i en Dokker container. Dette gør SQL Server mere konkurrencedygtige med Oracle, for at være sikker. Men det gør det også mere konkurrencedygtige med open source-relationelle databaser som MySQL og PostgreSQL.
Du får columnstore, og du får in-memory, og du får PolyBase!
Selvfølgelig, SQL-Server, selv om Linux, er ikke open source. Men gratis versioner findes. Specifikt, SQL Server Express og LocalDB er både gratis produkter. Mens de pålægger hukommelse restriktioner og andre begrænsninger, de arbejder godt, hvor mindre databaser, der er nødvendige. Problemet med disse udgaver, og selv deres ældre, der er betalt søskende som Web Edition og Standard Edition, er, at Microsoft har holdt de fleste af sine seneste gennembrud SQL Server teknologier ud af dem.
Smarte funktioner som columnstore indekser (der viser SQL Server i en kolonne gemme databasen, således data warehouse, data mart og hybrid transaktionsbeslutning-analytics-implementeringer), hukommelse, der er optimeret til tabeller (en in-memory transaktions database-teknologi) og PolyBase (som tillader, at data i Hadoop og Azure Blob Storage forespørges og sluttede som hvis det var placeret i SQL Server-tabeller) har været slukket grænser til ikke-erhvervskunder. Dette har hæmmet deres vedtagelse blandt udviklere, Uafhængige softwareleverandører (isv ‘ er — hvem har brug for til at opbygge deres programmer til at arbejde på Standard Edition for de kunder, der har det) og dermed hele økosystemet.
Der er en ting af fortiden, nu dog med Microsoft ‘ s annoncerer general availability (GA) af SQL-2016 SP1 sidste uge, stort set alle funktioner er tilgængelige i alle udgaver. Er der et par undtagelser? Ja, men de er logisk, baseret på, hvordan disse udgaver er indsat. Og Microsoft er også ved at blive meget tydelige og gennemskuelige om de undtagelser, der opsummerer dem i blog-indlæg om SP1, som jeg linkede til i det tredje afsnit af dette indlæg.
Microsoft hjerter udviklere
Så kan vi begynde at se en vej, hvor udviklere på deres Mac-og Linux-servere, der bruges til at arbejde med aircondition, gratis, open source-værktøjer, kan også kode mod SQL-Server, og den mest avancerede funktioner, uden at det koster dem penge, og uden at behøve en maskine (endda en virtuel), der kører Windows. Vi er der ikke endnu, men når SQL Server vNext på Linux, og den funktion/licenser politikker i SQL-2016 SP1 konvergerer, vil vi være forbandet tæt på.
Som en mangeårig Microsoft økosystemet professionelle, som giver mig optimisme. I en tidsalder, når man arbejder med data, der er kommet til at betyde arbejder med Linux og open source, det er en god vending i begivenhederne.
“R med dig, er virkelig en Kafkask oplevelse…”
En tilsvarende positiv udvikling, der fandt sted, da Microsoft har besluttet at frigive en version af Linux i sin cloud-baserede Hadoop distribution HDInsight. Det betød, at virksomheder i Hadoop økosystem, næsten alle af dem (herunder min arbejdsgiver, Datameer) er Linux-fokuseret, kan partner og integrere med HDInsight.
Dette har hjulpet HDInsight blive et fuldgyldigt Hadoop distribution, tilbyder specialiseret klynge typer ikke bare for generisk Hadoop arbejde, men også for at arbejde med Apache HBase, Storm og Spark. Og, bare meddelte i sidste uge, en ny klynge type for at arbejde med streaming data-orienteret Apache Kafka, er i public preview.
Og når Microsoft erhvervet Revolution Analytics, der var blevet de vigtigste kommercielle enhed bag open source-R programmeringssprog for statistik og machine learning, det var også godt. Selskabets Revolution R Enterprise (RRE) produkt, der nu sælges som Microsoft R Server, var bemærkelsesværdig i sin evne til at køre på en server, eller skala i hele klynger, der kører i et distribueret, i-database tilstand, i stedet for at køre standalone på en lokal PC eller Mac.
SQL Server 2016 omfatter integration af R-Server teknologi i form af SQL Server-R-Tjenester. Og mens det endnu ikke er en del af SQL Server på Linux, er en anden integration er Linux-baseret: R-Server for HDInsight, som er integreret med Apache Gnist, der kører på HDInsight. At produktet havde været i uddrag i et stykke tid, og i sidste uge gik i GA.
GA-version er tunet til at arbejde med Gnist 2.0, kan få adgang til data, der er gemt i Apache Hive eller i Parket-format i HDFS direkte, og kan også få adgang til data i Microsoft ‘ s HDFS-kompatibel storage-tjeneste kaldet Azure Data Sø Butik (ADLS).
Data Søen, og meget mere
Sidstnævnte, men baseret på Azure Blob Storage, giver endnu mere robust, fejltolerant, og har ingen begrænsninger på filstørrelser. Det har også gået GA, som har sin kammerat forespørgsel service, Azure Data Søen Analytics (ADLA). Kombinationen af ADLS og ADLA lade dig gøre Stor af Data arbejde med U-SQL, SQL-lignende query language, der kan udvides ved hjælp af Microsoft .NET og C#. Plus, ADLA job er at køre on-demand, snarere end at kræve en dedikeret klynge, som bringer en Platform as a Service sensibilitet Hadoop, som ADLA kører.
Det handler om alt der er, men det er en hel del. Fra relationelle SQL Server teknologi til R, Hadoop, Spark, Kafka og forskellige integrationer mellem dem, på både Windows og Linux, Microsoft, om ikke andet, er data og analytics passion, big time. Når du tilføjer ting som Kognitiv Service og Magt BI på toppen af alt dette er, at Microsoft har en vidtstrakte, vældige mur af data-teknologi, som er integreret, åbent og på tværs af platforme.