La scorsa settimana, Microsoft ha tenuto la sua annuale Connect() evento a New York, in occasione di un evento di spazio a destra alla bocca della Holland Tunnel. Connect() tende a essere focalizzato su Visual Studio e l’applicazione stack di sviluppo. Ma proprio come l’Holland Tunnel unisce una parte dell’anca Manhattan a Jersey City, NJ, Connect() legati insieme dev stack di annunci con un mazzo di annunci intorno alla Piattaforma di Dati di Microsoft.
Microsoft aveva due enormi annunci di circa SQL Server, probabilmente la Piattaforma Dati del componente legato più strettamente al mondo degli sviluppatori. Ma anche annunci nel mondo dei Big Data e analytics, in particolare intorno Azure Dati Lago; R Server, HDInsight e Apache Kafka.
Leggi anche: Perché Microsoft ha bisogno di SQL Server su Linux
Leggi anche: Microsoft SQL Server Successivo per Linux, Windows colpito il pubblico in anteprima
Leggi anche: Microsoft SQL Server Successivo: Cosa c’è sotto le coperte
Andiamo relazionale
Cominciamo con le cose relative a SQL Server, Microsoft dati del primo amore. E se ti ho amato prima, c’è anche la maggiore attrazione ora. I motivi: (1) la prima versione del prodotto per funzionare su Linux è ora in anteprima pubblica come parte di SQL Server “pagina relativa ai” Community Technology Preview 1 CTP (1) e (2) quasi tutte le caratteristiche del prodotto che sono esclusivi per l’Edizione Enterprise sono ora, con il rilascio di SQL Server 2016 Service Pack 1 (SP1), disponibili in tutte le edizioni, tra cui Standard, Web, Express e, con alcune note a piè di pagina, anche in LocalDB, l’applicazione-versione integrata del prodotto.
Come qualcuno che è stato coinvolto in una fase precoce del privato anteprima di SQL Server su Linux, sono molto contento che tutti possono check it out ora. Mentre il prodotto contiene solo i componenti di base del motore relazionale, e non più ampia di componenti di Reporting Services, Analysis Services o Servizi di Integrazione, è comunque una completa implementazione del prodotto, e può essere eseguito sia “sul metallo”, o in un Mobile contenitore. È compatibile con Suse, Ubuntu e Red Hat Enterprise Linux (RHEL) distribuzioni.
Chiudere le Finestre
La cosa più notevole di SQL Server su Linux è come, una volta che è installato e funzionante, non è notevole. In altre parole, mentre ci sono alcuni riga di comando di Linux strumenti per il prodotto, che sono chiaramente unico, interagisce con il server di un’applicazione, di strumenti di BI o anche un basato su Windows come strumento di SQL Server Management Studio, è praticamente indistinguibile da lavorare con la versione di Windows. È quasi una delusione.
Ma la grande differenza è che gli sviluppatori che stanno prendendo di mira i server Linux può lavorare con SQL Server. E anche gli sviluppatori che utilizzano Mac in grado di eseguirlo in locale, senza una connessione LAN o Internet, in esecuzione in una finestra Mobile contenitore. Questo rende SQL Server più competitivo con Oracle, per essere sicuri. Ma rende anche più competitivo con l’open source database relazionali come MySQL e PostgreSQL.
Si ottiene columnstore, e si ottiene in memoria, e si ottiene PolyBase!
Naturalmente, SQL Server, anche su Linux, non è open source. Ma le versioni gratuite non esistono. In particolare, SQL Server Express e LocalDB sono entrambi prodotti gratuiti. Mentre impongono i limiti di memoria e di altri vincoli, funzionano bene dove database di piccole dimensioni, sono necessari. Il problema con queste edizioni, e anche la loro età, pagate fratelli come Web Edition e Standard Edition, è che Microsoft ha mantenuto la maggior parte della sua ultima conquista, tecnologie di SQL Server.
Cool caratteristiche come gli indici columnstore (che diventa di SQL Server in una colonna del database di archivio, consentendo di data warehouse, data mart e ibridi transazionale-implementazioni di analisi), della memoria ottimizzato le tabelle (in memoria transazionale tecnologia di database) e PolyBase (che permette di trasferire i dati in Hadoop e Archiviazione Blob di Azure essere interrogato e si unì come se fosse situato nelle tabelle di SQL Server) sono stati off limits per i non-clienti Enterprise. Questo ha inibito la loro adozione tra gli sviluppatori, Fornitori di Software Indipendenti (Isv-che ha bisogno di costruire le proprie applicazioni per lavorare su Standard Edition, per quei clienti che hanno) e, per estensione, l’intero ecosistema.
Che è una cosa del passato ora, però, con Microsoft annuncia la disponibilità generale (GA) di SQL 2016 SP1 scorsa settimana, praticamente tutte le funzioni sono disponibili in tutte le edizioni. Ci sono un paio di eccezioni? Sì, ma sono logiche, in base a come tali edizioni sono distribuite. E Microsoft è anche molto chiaro e trasparente circa le eccezioni, riassumendole in un post del blog su SP1 che ho linkato nel terzo paragrafo di questo post.
Microsoft cuori sviluppatori
Così possiamo iniziare a vedere un percorso in cui gli sviluppatori sul proprio Mac e Linux server, abituato a lavorare con strumenti open source, può anche codice in SQL Server e le sue caratteristiche più avanzate, senza spendere soldi e senza bisogno di una macchina (anche virtuale) l’esecuzione di Windows. Non ci siamo ancora arrivati, ma quando SQL Server pagina relativa ai su Linux, e la funzione/politiche di licensing in SQL 2016 SP1 convergono, saremo dannati vicino.
Come un vecchio ecosistema Microsoft professionale, che mi dà ottimismo. In un’epoca In cui lavorare con i dati, è venuto a significare lavorare con Linux e l’open source, questo è un buon svolta degli eventi.
“R con voi è davvero un Kafkiano esperienza…”
Altrettanto positivo sviluppo si è verificato quando Microsoft ha deciso di rilasciare una versione per Linux del suo cloud-based di Hadoop distribuzione, HDInsight. Significava che le aziende nell’ecosistema Hadoop, quasi tutti dei quali (tra cui il mio datore di lavoro, Datameer) sono Linux-concentrato, potrebbero collaborare e di integrarsi con HDInsight.
Questo ha aiutato HDInsight diventata una vera e Hadoop di distribuzione, offrendo specializzati tipologie di cluster non solo per generico Hadoop lavoro, ma anche per lavorare con Apache HBase, Tempesta e la Scintilla. E, annunciato la scorsa settimana, un nuovo tipo di cluster per lavorare con i dati di flusso-oriented Apache Kafka, sia in pubblico che in anteprima.
E quando Microsoft ha acquisito la Rivoluzione Analytics, che era diventato il principale ente commerciale dietro l’open source R linguaggio di programmazione per la statistica e l’apprendimento automatico, che è stato troppo buono. Azienda Rivoluzione R Enterprise (RRE) prodotto venduto come Microsoft R Server, è stato degno di nota per la sua capacità di eseguire su un server, o di scala attraverso l’intero cluster, in esecuzione in un ambiente distribuito, in-database modalità, piuttosto che esegue una versione standalone su un PC o Mac.
SQL Server 2016 include l’integrazione di R Server di tecnologia in forma di SQL Server R Servizi. E mentre che non è ancora parte di SQL Server su Linux, un altro tipo di integrazione è basato su Linux: R Server per HDInsight, che è integrato con Apache Scintilla, in esecuzione su HDInsight. Che prodotto era stato in anteprima per qualche tempo, e la settimana scorsa è andato in GA.
La GA versione è ottimizzata per lavorare con Spark 2.0, possono accedere ai dati memorizzati in Apache Hive o in Parquet formato in HDFS direttamente, e possibile anche accedere ai dati in Microsoft HDFS di archiviazione compatibile con il servizio di Azure Dati Lago Store (ADL).
Dati Lago, e più
Quest’ultimo, pur basandosi su Azure Blob Storage, fornisce anche il più robusto tolleranza di errore e non ha alcun limite sulla dimensione dei file. Si è andato GA, così come il suo compagno di query di servizio di Azure Dati Lago di Analytics (ADLA). La combinazione di RIPOSO e ADLA ti permettono di fare il Grande lavoro Dati con U-SQL, SQL come linguaggio di query che è estendibile utilizzando Microsoft .NET e C#. Inoltre, ADLA i lavori sono eseguiti su richiesta, piuttosto che di un cluster dedicato, che porta un Platform as a Service sensibilità per Hadoop, su cui ADLA corre.
Questo è tutto quel che c’è, ma è un bel po’. Da SQL Server relazionale tecnologia di R, Hadoop, Scintilla, Kafka e varie integrazioni tra di loro, su Windows e su Linux, Microsoft, se non altro, ha i dati di analytics e passione, grande tempo. Quando si aggiunge cose come Cognitive Servizi e Power BI in cima a tutto questo, Microsoft ha una tentacolare, formidabile muro di dati la tecnologia che è integrato, aperto e multi-piattaforma.