Letzte Woche, Microsoft hielt seine jährliche Connect () – event in New York City, um eine Veranstaltungsfläche direkt an der Mündung des Holland Tunnel. Connect () – neigt dazu, sich auf die Visual Studio und die Anwendung-Entwicklungs-stack. Aber genau wie den Holland-Tunnel verbindet eine hippe Teil von Manhattan, Jersey City, NJ, Connect() miteinander verbunden, die dev-stack Ankündigungen mit einer Reihe von Ankündigungen rund um die Microsoft Daten Plattform.
Microsoft hatte zwei große Ankündigungen rund um SQL Server, die wohl die Daten der Plattform-Komponente gebunden, die eng an die Entwickler-Welt. Es hatte aber auch Ankündigungen in die Welt von Big Data und analytics, speziell rund um Azure Data See; R-Server, HDInsight und Apache Kafka.
Lesen Sie auch: Warum Microsoft muss SQL Server auf Linux
Lesen Sie auch: Microsoft SQL-Server Weiter, der für Linux, Windows Treffer public preview
Lesen Sie auch: Microsoft SQL-Server Weiter: Was ist unter der Decke
Let ‘ s get relationalen
Beginnen wir mit dem Zeug in Bezug auf SQL Server, Microsoft data die erste Liebe. Und wenn ich liebte es, bevor es eine noch größere Anziehungskraft jetzt. Die Gründe: (1) die erste version des Produkts ausführen, unter Linux ist jetzt in der public preview als Bestandteil von SQL Server “vNext” Community Technology Preview 1 (CTP 1) und (2) fast all die coolen features des Produkts, die waren exklusiv für die Enterprise Edition sind jetzt, mit der Veröffentlichung von SQL Server 2016 Service Pack 1 (SP1), erhältlich in jeder Ausgabe, einschließlich Standard -, Web -, Express-und mit einigen Fußnoten, auch in der LocalDB die Anwendung eingebettete version des Produkts.
Als jemand, der beteiligt war, frühzeitig in die private preview von SQL Server auf Linux, ich bin wirklich froh, dass jeder check it out jetzt. Während das Produkt enthält nur die core-relationale engine, und nicht breiter Komponenten wie Reporting Services, Analysis Services und Integration Services, es ist aber dennoch eine vollwertige Umsetzung der Produkt und kann sowohl “on the metal”, oder in einem Docker-container. Es ist kompatibel mit Suse, Ubuntu und Red Hat Enterprise Linux (RHEL) – Verteilungen.
Schließen Sie die Windows
Die bemerkenswerteste Sache über SQL Server auf Linux ist, wie, sobald es installiert ist und funktioniert, es ist nicht bemerkenswert überhaupt. In anderen Worten, es gibt zwar einige Linux-Befehlszeilen-tools für die Produkt -, die sind eindeutig, die Interaktion mit dem server aus einer Anwendung, die BI-tool oder auch ein Windows-basiertes tool wie SQL Server Management Studio, ist praktisch nicht mehr zu unterscheiden von der Arbeit mit der Windows-version. Es ist fast ein let-down.
Aber der große Unterschied ist, dass Entwickler, die gezielt auf Linux-Servern kann die Arbeit mit SQL-Server jetzt. Und auch Entwickler, die mit Macs können Sie lokal auszuführen, ohne ein LAN oder Internet-Verbindung, indem Sie es in einen Docker-container. Das macht der SQL-Server mehr im Wettbewerb mit Oracle, um sicher zu sein. Aber es macht es auch mehr Wettbewerb mit open-source-relationalen Datenbanken wie MySQL und PostgreSQL.
Sie erhalten columnstore, und Sie bekommen im Speicher, und Sie erhalten PolyBase!
Natürlich, SQL-Server, auch auf Linux, ist nicht open-source. Aber die kostenlosen Versionen existieren. Speziell, SQL Server Express und LocalDB sind die beiden gratis-Produkte. Während Sie verhängen Speicher-Beschränkungen und andere Beschränkungen, Sie arbeiten gut, wo kleinere Datenbanken benötigt werden. Das problem bei diesen Editionen, und auch zu Ihrer älteren, bezahlt Geschwister wie Web-Edition und Standard-Edition ist, dass Microsoft gehalten hat, die meisten seiner neuesten Durchbruch SQL Server-Technologien aus.
Coole features wie columnstore-Indizes (die sich SQL Server in einer Spalte speichern, Datenbank, aktivieren von data warehouse -, data mart-und hybrid-Transaktions-analytics-Implementierungen), memory-optimierten Tabellen (eine in-memory-transaktionalen Datenbank-Technologie) und PolyBase (die es erlaubt, Daten in Hadoop-und Azure-Blob-Speicher abgefragt werden und trat, als ob es wurden in SQL Server-Tabellen) wurden off-limits für nicht-Enterprise-Kunden. Diese gehemmt hat Ihre Annahme unter den Entwicklern, Independent Software Vendors (ISVs –, die Sie brauchen, um zu bauen Ihre Anwendungen auf einem Standard Edition-für jene Kunden, die es haben) und, durch Verlängerung, das gesamte ökosystem.
Das ist eine Sache der Vergangenheit, jetzt aber, mit Microsofts Ankündigung der Allgemeinen Verfügbarkeit (general availability, GA) von SQL 2016 SP1 Letzte Woche, nahezu alle Funktionen sind in allen Editionen verfügbar. Gibt es ein paar Ausnahmen? Ja, aber Sie sind logisch, basieren auf, wie diese Editionen bereitgestellt werden. Und Microsoft ist auch sehr schlicht und transparent über die Ausnahmen, zusammengefasst in der blog-post SP1, die ich verlinkte, in dem Dritten Absatz von diesem post.
Microsoft hearts-Entwickler
So können wir beginnen zu sehen, einen Pfad, in dem die Entwickler auf Ihrem Mac-und Linux-Server verwendet, um die Arbeit mit freier, open-source-tools, können auch code gegen SQL Server und die meisten erweiterten Funktionen, ohne es kostet Sie Geld, und ohne dass eine Maschine (auch ein virtuelles) Windows ausgeführt werden. Wir sind noch nicht da, aber wenn SQL Server vNext unter Linux, und die feature – /Lizenzpolitik, die in SQL 2016 SP1 konvergieren, werden wir verdammt nah dran.
Als langjähriger Microsoft-ökosystem professional, das gibt mir Optimismus. In einem Alter, bei der Arbeit mit Daten ist gekommen, um meine Arbeit mit Linux und open source, dies ist eine gute Wendung der Ereignisse.
“R mit dir ist wirklich eine kafkaeske Erfahrung…”
Eine ähnlich positive Entwicklung stattgefunden, als Microsoft beschlossen, um die Freigabe der Linux-version seiner cloud-basierten Hadoop distribution HDInsight. Es bedeutete, dass die Unternehmen in den Hadoop-ökosystem, die praktisch alle von denen (auch mein Arbeitgeber, Datameer) sind Linux-konzentriert, könnte partner und integrieren Sie mit HDInsight.
Dies hat dazu beigetragen, HDInsight zu einem vollwertigen Hadoop-distribution, bieten spezialisierte cluster-Typen nicht nur für generische Hadoop arbeiten, aber auch für die Arbeit mit Apache HBase, Storm und Spark. Und, gerade Letzte Woche angekündigt, eine neue cluster-Typ für die Arbeit mit streaming-Daten-orientierte Apache Kafka, ist in der öffentlichen Vorschau.
Und wenn Microsoft erworben Revolution Analytics, der hatte sich zum wichtigsten kommerziellen Unternehmen hinter der open-source-R-Programmiersprache für Statistik und dem maschinellen lernen, das war auch gut. Das Unternehmen ist Revolution R Enterprise (RRE) Produkt, jetzt verkauft als Microsoft R-Server, war bemerkenswert in seiner Fähigkeit, auf einem server ausführen, oder Skala ist in der gesamten Cluster ausgeführt wird in einer verteilten, Datenbank-Modus, sondern läuft eigenständig auf einem lokalen PC oder Mac.
SQL Server-2016 umfasst die integration der R-Server-Technologie in form von SQL-Server-R-Dienstleistungen. Und zwar ist das noch nicht Teil von SQL Server, die auf Linux, ein anderes integration ist Linux-basiert: R-Server, die für HDInsight, integriert mit Apache Spark, läuft auf HDInsight. Das Produkt hatte in der Vorschau für einige Zeit, und Letzte Woche ging in GA.
Die GA-version ist abgestimmt auf die Arbeit mit Spark 2.0, Zugriff auf Daten in Apache Hive oder in Parkett-format in HDFS direkt, und können auch auf Daten zugreifen, die in Microsoft HDFS-kompatiblen storage-service namens Azure Data-Lake-Store (ADLS).
Daten, die See, und mehr
Letztere, obwohl, basierend auf Azure-Blob-Speicher sorgt für noch mehr robuste Fehlertoleranz und hat keine Begrenzung der Dateigröße. Es hat auch GA gegangen, da hat sein Begleiter, query service, Azure Data Lake-Analysen (ADLA). Die Kombination von ADLS und ADLA lassen Sie Big Data arbeiten, mit U-SQL eine SQL-ähnliche query-Sprache, und ist erweiterbar using Microsoft .NET und C#. Plus, ADLA-Aufträge sind bei Bedarf ausführen, anstatt dass eine dedizierte cluster, die bringt eine Platform-as-a-Service-Sensibilität für Hadoop, auf denen ADLA läuft.
Das ist alles, was es ist, aber es ist eine ganze Menge. Relationale SQL Server-Technologie, R, Hadoop, Spark, Kafka und verschiedene Integrationen zwischen Ihnen, die auf Windows-und auf Linux -, Microsoft -, wenn nichts anderes, hat Daten und Analysen Leidenschaft, große Zeit. Wenn Sie das hinzufügen Dinge wie Kognitive Leistungen und Power BI am Anfang aller dieser, hat Microsoft eine weitläufige, gewaltigen Mauer von Daten-Technologie, die die integrierte, offene und cross-Plattform.