Omdöme: SQL Server 2017 lägger Python, diagram bearbetning och körs på Linux

0
229

Noll

I dag, på sin Ignite konferens i Orlando, Microsoft meddelar den allmänna tillgängligheten av en ny version av sitt flaggskepp operativa databas, SQL Server 2017.

SQL Server är en produkt som jag har arbetat med under nästan hela min karriär. Jag började med version 4.2 för Windows 1993 och har arbetat med och granskat noggrant varje efterföljande utsläpp, inklusive detta. Det jag har tagit bort från allt detta arbete och utvärdering är att medan SQL Server har ständigt förbättrats, medan den har moderniserats och lagt till många funktioner och kombinerade teknik, på många sätt, det känns ändå som att det är samma databas som jag började arbeta tillsammans med nästan 25 år sedan.

Ibland tror jag att utvecklare och administratörer databas behöver förtrogenhet. Vid andra tillfällen som de behöver för innovation och förtroende för att en produkt laget har fler nya grejer på gång. Kunder behöver SQL Server är detsamma men att de behöver det för att förändra och förbättra. Det är verkligen SQL Server unik utmaning: det måste vara trogen sitt arv, och ändå undvika stagnation, stå sig i konkurrensen med de till synes oändlig mängd nya data teknik, både kommersiella och open source.

summarysql-2017.jpg

Sammanfattning av SQL Server 2017 nya funktioner

Kredit: Microsoft

Denna nya version av SQL Server fortsätter att uppfylla dessa två krav. Det tillför nya funktioner från världar av data vetenskap och NoSQL. Det erbjuder plattformsoberoende funktioner och Docker behållare kompatibilitet. Men det stärker även sin investering i centrala databasen på motorns prestanda, enkel index underhåll, hög tillgänglighet och data warehouse prestanda. Det är en svår balans och en som andra leverantörer databas inte har att möta. Medan detta kan vara Microsofts kors att bära, företaget gör ganska bra med det, att vända en formidabel utmaning i en positiv marknad konkurrensfördel.

Neo-retro: SQL Server för Linux
I ett drag som kan tyckas ironiskt att marknaden och är ännu ganska konsekvent med SQL Server arv, utgivningen av SQL Server 2017 förebådar SQL Server återgå till *NIX-plattform, med en ny version av produkten. Och trots denna utveckling är legacy-konsekvent (tidiga versioner av SQL Server, utvecklat i samarbete med Sybase, sprang också på UNIX), det är fortfarande en mycket stor affär.

Läs också: Microsoft SQL Server 2017 för Linux och Windows rör sig framåt med en första Release Candidate

SQL Server har ökat ganska kraftigt i popularitet under åren. Men populariteten av server-side Linux har ökat, och Mac-datorer har ökat i popularitet med utvecklare. Detta har inneburit att en del kunder har kört ett antal Windows-servrar i deras datacenter bara för SQL Server. Det innebar också att Mac-och Linux-maskiner som behövs för att ansluta till SQL Server över nätverket, och har inte kunnat köra den lokalt om inte på en Windows virtual machine. Båda dessa frågor har varit blockerare för att antas.

Läs också: Varför måste Microsoft SQL Server på Linux

Med Linux-kompatibilitet, Microsoft börjar arbeta för att undanröja dessa antagande blockerare. SQL Server kan nu köras på Windows-servrar, Linux-baserade servrar, eller en kombination av de två. Linux-versionen kan även köras i Docker behållare (som också kan vara en Windows – eller Linux-baserad) vilket gör det nästan trivialt att köras på en Mac. I själva verket, om en utvecklare maskin redan har ett Docker installeras, körs och har tilldelats minst 4GB minne till den, sedan två kommandon, in i en Mac-eller Linux-maskin ‘ s terminalfönster, kommer att ladda ner, installera och starta den produkt som körs. Samma teknik fungerar på Windows-maskiner, trots det faktum Windows-versionen kan installeras på metall.

Windows-baserade SQL Server-verktyg kan ansluta till Windows eller Linux instanser av SQL Server, Windows så att utvecklare inte behöver ändra sina toolsets. Samtidigt, dessa verktyg är inte obligatoriska: Microsoft erbjuder Linux kommandorad verktyg för SQL Server, och det viktigaste är installerad i Docker bilden som standard. För människor som vill något mer grafiskt, men ändå lätt, Microsoft erbjuder mssql förlängning för sin Visual Studio-Kod verktyg för utveckling, som går på både Linux och Mac. Det kan även köra Windows, så att även Microsoft-plattformen utvecklare möjlighet att använda lätta verktyg.

Att flytta från verktyg till companion teknik, många av dem, inklusive SQL Server Analysis Services och SQL Server Reporting Services, finns inte tillgängligt i Linux-versioner, åtminstone inte ännu. Men samtidigt paket som skapats för SQL Server Integration Services (SSIS), Microsofts ståndaktiga ETL (extract, transform och last) verktyg, måste vara skriven på Windows-maskiner, själva tjänsten kan köras på Linux och SSIS-paket som kan köras på Linux kommandorad genom att använda kommandot dtexec.

Unifying-arkitektur
Även om inte alla SQL Server följeslagare teknik finns tillgänglig för Linux, alla funktioner inom SQL Server-relationsdatabas i motorn finns där. Även SQL Server, Alltid På hög tillgänglighet funktionen fungerar – och Windows-och Linux fall kan blandas tillsammans i samma Grupp för Tillgänglighet. Prestanda är också jämförbara på de två plattformarna.

Anledningen till funktionen paritet mellan Windows-och Linux-versionerna av produkten är SQL-Plattform Abstraction Layer (PAL), som genomförs på varje OS. Som det fullständiga namnet antyder, Kompisar abstrakt bort skillnaderna mellan de två operativsystemen, och ger ett gemensamt gränssnitt som en enda kodbas kan köra.

Med den här arkitekturen, som alla har skapats för SQL Server-databas motor på en plattform som är tillgänglig på den andra. Och PALs genomförs på ett effektivt sätt. Microsoft uppnått rekord icke-klustrade TPC-H och 2-uttaget TPC-E benchmark resultat med SQL Server 2017, och en av TPC-H resultat uppnåddes med Linux-versionen av produkten.

Hon förblindade mig med (data) vetenskap!
Medan SQL Server för Linux är 2017 release ‘ s banner funktion, det finns ytterligare två stora förbättringar, samt en massa mindre företag som tillsammans gör SQL Server betydligt mer robust.

ml-services.jpg

SQL Server Machine Learning Services

Kredit: Microsoft

På Data-Vetenskap sidan, Microsoft har tagit SQL Server-R-Tjänster, som infördes i och med 2016 release, och lagt till stöd för programmeringsspråket Python. Den förbättrade funktionen, som nu kallas SQL Server Machine Learning Services (ML Tjänster), kan koden i antingen språk för att köra direkt på SQL-Servern. Ett annat alternativ är att skriva och köra R/Python-kod på en arbetsplats, men har det delegera det tunga arbetet att köra på SQL Server.

Läs också: Microsoft Data Amp förebådar Python i SQL Server 2017, och mycket mer
Läs också: Microsofts Strategi R

R och Python redan hade tillgång SQL Server, naturligtvis, men bara om du kör externt, och därmed överföra data ifrågasatt från SQL Server till den dator som kör koden. Kör koden direkt på SQL Server undviker sådana uppgifter rörelse, gör det möjligt att skapa och utbildning av automatisk ML modeller på servern, över stora volymer av data som analyseras på plats.

Att hålla betyg
Dessa modeller kan sedan vara numrerade och lagras i SQL Server-databaser. Senare modeller kan hämtas och de är numrerade, och förutsägelser kan köras mot dem, med hjälp av SQL Server-data som indata. Denna process, kallad scoring, kan genomföras i koden skrivs antingen R eller Python, via ad hoc-skript eller lagrade procedurer. Och sedan lagrad procedur samtal kan köra på en regelbunden basis med hjälp av en komponent som kallas SQL Server Agent, hela poängskala kan vara server-baserad och grundligt operationaliseras. Det är en stor sak, med tanke på att scoring har vanligen varit att köra på en mer ad hoc-basis, på data forskarnas egna maskiner.

Poäng berättelsen blir ännu bättre i SQL Server 2017. Utanför tillsats av Python som ett språk som kan användas för poängskala, T-SQL-koden i sig kan nu utföra “native poäng” samt, med hjälp av språket är nytt FÖRUTSÄGA funktion. Så länge de modeller som fått sig mot har utbildats och lagras i databasen i föreskriven RevoScaleR eller RevoScalePy format, T-SQL kan användas för att göra mot dem, oavsett om eller inte R eller Python är installerat på servern.

Detta möjliggör en mycket viktig separation av oro, där Data Forskare kan bygga och utbilda ML modeller i deras egen miljö, och sedan lagra dem i databasen, där alla utvecklare kan skriva T-SQL-frågor för att göra mål mot dem. Och om SQL Server som värd har Grafiska Processing unit (Gpu) ombord, data forskare kan se ett ännu större vinster, än avskaffande av data rörelse, genom utbildning av sina modeller.

Företaget, redo eller inte
En annan T-SQL – /Data-Vetenskap integration i SQL Server 2017 är möjligheten att lägga till en R-paket för (moduler som fungerar som språk extensions) via T-SQL: s nya SKAPA EXTERNA BIBLIOTEK kommando, och lagras i särskilda databaser, snarare än att läggas till genom R s installera.paket () – funktionen och göras tillgängliga globalt. Detta ger databasadministratörer större och mer detaljerad kontroll över resurser och förmågor som är påslagen eller avstängd.

Denna kombination av egenskaper gör stora framsteg mot att Data Vetenskapen framåt i den vanliga enterprise computing. Den gränslösa SQL Server i företagets teknik miljöer ger operationaliseras Data Vetenskap på en större scen. Nu är det upp till Microsoft för att driva på införandet av dessa funktioner, snarare än att bara göra dem tillgängliga.

Grafiskt språk
Den andra stora tillägg till SQL Server 2017 är nytt stöd för diagram behandling.

Så kallade NoSQL-databaser, som grafdatabaser utgör en viktig kategori, har varit en nagel i Microsofts sida för minst sex år. Och trots det faktum att de kan vara lite esoteriska och blek i antagandet nivåer jämfört med databasen produkter baserade på konventionella relationella teknik (som SQL Server), de kan vara mycket användbara för viss databas scenarier.

graph.jpg

Diagram behandling handlar om noder och kanter

Kredit: Microsoft

I stället för rader och kolumner, tabeller i grafdatabaser innehåller “noder” (kallas ibland “hörn”) och “kanter.” Noderna representerar enheter medan kanterna representerar relationer mellan dem. Med relationer kodifierad i enheten, snarare än tabellen nivå, blir det mycket lättare att göra saker som att få alla enheter som är närstående till en annan i synnerhet.

Denna typ av fråga är vanligt när man arbetar med någon domän där nätverk är involverade, inklusive sociala nätverk. Vill få alla kommentarer till en viss position? Easy peasy. Vill veta alla vänner två personer har gemensamt? Bit av kakan.

SQL Server-utvecklare kan enkelt ange den SOM NOD eller SOM KANT nyckelord i deras CREATE TABLE-kommandon när man ska bygga tabeller som kommer att lagra grafen enheter. Vid frågor någon sådan tabell, de kan då använda den matchade sökordet i deras SELECT-satser för att svara på-nätet-relaterade frågor, såsom de sociala medier som vi just diskuterat.

SQL Server kan fråga över en heterogen blandning av diagram tabeller och konventionella. Det kan också ta columnstore index i en accelererande frågor som kan dra nytta av dem.

I andra nyheter
Ja, Linux, Python och diagram behandling är en hel del, men det finns mer. Här finns en slutlig sammanfattning av vad som är nytt i relationsdatabas motor.

SQL Server vektor-behandling-baserat parti utförande läget är nu tillgänglig för hela genomförandet av R-eller Python kod. Eftersom mycket av det arbete som tenderar att göras i R och Python innebär aggregering, batch mode – vilka processer rader av data flera på en gång, kan vara till stor hjälp.

Två andra nya batch-läge funktioner, minne ger feedback och adaptiv ansluter sig, kommer att förbättra SQL Server prestanda och effektivitet också.

I den operativa analytics institutionen, icke-klustrade olika Columnstore index (NCCIs), som introducerades i SQL Server 2012, kan nu byggas och byggas om utan att ta bord de index offline, vilket gör operativa analytics mer möjligt att genomföra.

Blob (binary large objects, som hela filer som lagras i en tabell) i Columnstore index nu kan vara komprimerat för att spara utrymme, och Columnstore index kan bearbeta dem i komprimerat format, vilket också snabbar säkerhetskopior.

SQL 2017 nya återupptas index verksamhet funktionen gör att indexet återskapas att återupptas efter att en databas fel eller manuellt avbryta operationen, snarare än att behöva startas om från början, när databasen är tillbaka online.

SQL servers query processor kan nu automatiskt upptäcka och åtgärda så kallade plan regressioner, som uppstår när det omformulerar det bästa sättet att fråga en tabell, men “glömmer” att vissa optimeringar det gjorde att den tidigare planen som gäller fortfarande.

SQL Server är I Minnet OLTP anläggning (en.k.en. “Hekaton”), som bearbetar data i minnet och sammanställer T-SQL lagrade procedurer ner till maskinkod, har kastat många av sina begränsningar, vilket gör att funktionen kan användas i många fler situationer.

Utöver relationella
Även om huvuddelen av de nya funktionerna i SQL Server 2017 levereras i kärnan relational database management system (RDBMS) motor, andra komponenter i SQL Server svit av teknik är att se en viss förbättring.

Låt oss börja med SQL Server Analysis Services (SSAS), vars Tabellform Läge motorn är Enterprise-versionen av tekniken bakom Excel-data modell och Power Pivot; Power BI Skrivbord, den Makt BI molntjänst och den nya Azure Analysis Services förhandsgranska service. SSAS Tabulär fortsätter att se investeringar som ger dess funktion som i nära paritet med SSAS ” klassiska Flerdimensionell modell.

Först ut, i Tabellform läget är nu standard installation alternativ för Analysis Services. En ny 1400 kompatibilitet nivå gör att SSAS Tabulär s verktyg (en del av Visual Studio-baserade SQL Server Data Tools – SSDT) för att ge samma datainsamling dialoger och mycket av den data source-anslutning som är tillgängliga i Excel-2016 för Windows och Makt BI Skrivbordet. Detta omfattar motsvarande uppgifter som förberedelse gränssnitt och använder sig av samma underliggande M programmeringsspråk som finns i Power BI och Excel. SSDT verktyg för SSAS nu också har en redigerare för Tabellform motorn är DAX (Data Analysis eXpressions) språket.

Kodning tips hastighet upp data-uppdatering; en Dölja Medlemmar egendom som slutligen gör att trasiga hierarkier i dimensioner; visa detaljer stöds nu för drillthrough-åtgärder från kunder som Excel, object-level security har lagts till, dynamic management views har blivit bättre, och en operatör och en CONTAINSROW funktion har lagts till i DAX.

SQL Server Reporting Services (SSRS) har lagt till en kommentar-funktionen, för gemensam genomgång av rapporter, och en DAX redaktör har lagts till i frågan designer, både i SSDT och fristående Report Builder program. SSRS finns också i en förbättrad inkarnation, som Makt BI Rapport Server. Mer information om det som visas nedan.

SQL Server Integration Services har lagt till en ny skala-funktionen och, som redan diskuterats, kan köras på SQL Server för Linux. Det ger också ökad konnektivitet till Microsoft Dynamics AX Online och Microsoft Dynamics CRM Online.

På den affärsmässiga sidan
Det finns mer att SQL Server än produktens funktioner, naturligtvis, den sidan är också viktigt.

Microsoft är inte att införa eventuella prishöjningar med denna version av produkten. I själva verket, för att Linux-versionen, Microsoft erbjuder en pr – (begränsad tid) för Software Assurance (SA)-endast abonnemang för Standard-och Enterprise-utgåvorna av produkten. Detta är lite som att få en fri licens så länge du registrerar dig för underhåll och, enligt Microsoft, innebär en 30% rabatt på alla-i arvode. När du kombinerar den här kampanjen med det faktum att SQL Server Developer Edition är gratis (en politik som Microsoft har inletts i början av förra året) får kunder open source-som nationalekonomi med SQL Server.

Och på tal om SA, SQL Server Enterprise Edition (EE) kunder som har det kommer att vara berättigad till nya lokaler analytics produkten: Power BI Rapport Server (PBIRS). PBIRS gör det möjligt för Företaget på lokaler leverans av Microsoft Power BI-rapporter, tidigare tillgängligt endast genom ett moln prenumeration (eller, om så bestäms e-post-baserade fildelning).

Som det visar sig, PBIRS är en full delmängd av SQL Server Reporting Services (SSRS), och därmed befästa alla Microsofts rapportering och data visualisering produkter (SSRS, SSRS Mobil Rapporter och Makt BI) i ett Företag rapportering plattform och Webb-baserad portal. Det enda andra sättet att förvärva PBIRS är genom en Effekt av BI-Premium-abonnemang, som startar på $4,995/månad för en enda dedikerad P1 nod, med 8 virtuella kärnor.

Bara 16 månader senare, en stor release
Som gör det möjligt för SQL Server-teamet att korta cyklerna för den konventionella på lokaler utgåvor (“box produkt” i Microsoft språkbruk) och inkluderar funktioner som redan har krigsvana. Det är därför vi får SQL Server 2017 cirka 16 månader efter utgivningen av SQL Server 2016, och vi få stora nya funktioner som Linux, Python, diagram bearbetning, och en massa mindre förbättringar för att hålla tidigare släppt har väl avstämd och relevant.

SQL Server-versioner som används för att komma vart 2-3 år, med en del ganska “big bang” – förändringar och medföljande uppmaningar kring utbildning, beredskap och uppgraderingar. Nu, med SQL Server-kod bas som används av Azure SQL Databasen också, har förbättringar implementeras och användas i produktion, vid kortare intervaller och med mindre…tja…hoopla.

För SQL Server, big bang släpper bli mer som tillfällig roll-ups av slipstream-cloud produktens funktioner. Skillnaderna mellan SQL Server och dedikerad NoSQL databaser blir mindre akut. Data Vetenskap, analytics och operativ teknik är att blanda ihop och blir mer operationaliseras. BI på desktop, server, oracle och PaaS moln delar samma grundläggande engine-teknik. Operating system/plattform skillnader finns bokstavligen få tas bort.

En ny databas world order
Jag är en Microsoft Data Plattform MVP, och inte på något sätt en objektiv observatör. Som sagt, min egen allvar observation är att Microsofts kombination av Företaget äldre, offentliga moln framgångar, utvecklare vänlighet och senare skolan-i-hårt-knackar utbildning gör det i en ledande position inom branschen att ta på sig denna nya normala i världen av data och teknik generellt. SQL Server 2017 är en viktig artefakt i övergången till ledarskap.

I databasen världen, hastighet ökar och vägbulor jämna ut. Det är en ständig ström av nya förmågor, med lite tid att vila, men med mindre tröghet att övervinna, som utövare och användare är ständigt i rörelse, ungefär som data i sig.

0