La semaine dernière, Microsoft a tenu sa annuels Connect() de l’événement dans la Ville de New York, lors d’un événement de l’espace de droit à l’embouchure de la Holland Tunnel. Connect() tend à être concentré sur Visual Studio et le développement de l’application de la pile. Mais, tout comme le Holland Tunnel se joint à une hanche cadre de Manhattan, à Jersey City, NJ, Connect() attachés ensemble le dev de la pile des annonces avec un tas d’annonces autour de la Plateforme de Données Microsoft.
Microsoft avait deux énormes annonces autour de SQL Server, sans doute la Plate-forme de Données de la composante liée plus étroitement le développeur monde. Mais il avait aussi des annonces dans les domaines du Big Data et de l’analytique, en particulier dans Azure Données d’un Lac; R Serveur, HDInsight et Apache Kafka.
Lire aussi: Pourquoi Microsoft a besoin de SQL Server sur Linux
Lire aussi: le Serveur SQL de Microsoft Suivant pour Linux, Windows frappé public preview
A lire aussi: Microsoft SQL Server Suivant: Ce qui est sous les couvertures
Let’s get relationnel
Commençons par les choses relatives à SQL Server, Microsoft d’abord les données de l’amour. Et si je l’ai aimé avant, il y a encore une plus grande attraction maintenant. Les raisons: (1) la première version du produit pour fonctionner sur Linux est maintenant en pré-version publique dans le cadre de SQL Server “vNext” Community Technology Preview 1 CTP (1) et (2) presque toutes les fonctionnalités du produit exclusif à l’Édition d’Entreprise sont maintenant, avec la sortie de SQL Server 2016 Service Pack 1 (SP1), disponibles dans toutes les éditions, y compris Standard, Web, Express et, avec quelques notes de bas de page, même dans LocalDB, l’application-version embarquée du produit.
Comme quelqu’un qui a été impliqué dès le début dans le privé aperçu de SQL Server sur Linux, je suis vraiment heureux que tout le monde peut le vérifier maintenant. Alors que le produit contient seulement le noyau du moteur relationnel, et pas plus large des composants comme Reporting Services, Analysis Services ou des Services d’Intégration, il est néanmoins à part entière de la mise en œuvre du produit, et peut fonctionner à la fois “sur le métal”, ou dans un conteneur Docker. Il est compatible avec Suse, Ubuntu et Red Hat Enterprise Linux (RHEL) distributions.
Fermer les Fenêtres
La chose la plus remarquable au sujet de SQL Server sur Linux est comment, une fois qu’il est installé et fonctionne, il n’est pas remarquable. En d’autres termes, bien qu’il existe certains Linux outils de ligne de commande pour les produits qui sont clairement unique d’interagir avec le serveur à partir d’une application, BI outil ou même un outil Windows comme SQL Server Management Studio, est pratiquement impossible à distinguer de travail avec la version Windows. C’est presque une déception.
Mais la grande différence est que les développeurs qui ciblent des serveurs Linux peut fonctionner avec SQL Server maintenant. Et même les développeurs qui utilisent des Mac pouvez l’exécuter en local, sans connexion LAN ou sur Internet, en l’exécutant dans un conteneur Docker. Cela rend SQL Server plus compétitif avec Oracle, pour en être sûr. Mais elle rend aussi plus concurrentiel avec l’open source relationnel de bases de données comme MySQL et PostgreSQL.
Vous obtenez columnstore, et vous obtenez en mémoire, et vous obtenez PolyBase!
Bien sûr, SQL Sever, même sur Linux, n’est pas open source. Mais des versions gratuites existent. Plus précisément, SQL Server Express LocalDB sont à la fois des produits gratuits. Alors qu’ils imposent des restrictions de mémoire et d’autres contraintes, ils fonctionnent bien, où les petites bases de données sont nécessaires. Le problème avec ces éditions, et même de leurs vieux payé les frères et sœurs comme le Web Edition et Standard Edition, c’est que Microsoft a gardé la plupart de sa découverte la plus récente des technologies SQL Server.
Fonctionnalités sympas comme columnstore index (qui tourne SQL Server dans une colonne magasin de base de données, permettant d’entrepôt de données, data mart et hybride transactionnelle analyse mises en œuvre), de la mémoire optimisée tables (une mémoire transactionnelle de la technologie de base de données) et PolyBase (ce qui permet aux données dans Hadoop et Azure Blob Storage être interrogé et a rejoint comme si elle était située dans les tables SQL Server) ont été interdites aux non-clients de l’Entreprise. Cela a inhibé leur adoption entre les développeurs, les Fournisseurs de Logiciels Indépendants (Isv — qui en ont besoin pour construire leurs applications pour travailler sur l’Édition Standard pour les clients qui en ont) et, par extension, l’ensemble de l’écosystème.
C’est une chose du passé, mais maintenant, avec Microsoft annonce la disponibilité générale (GA) de SQL 2016 SP1, la semaine dernière, pratiquement toutes les fonctionnalités sont disponibles dans toutes les éditions. Il y a quelques exceptions près? Oui, mais ils sont logiques, basé sur la façon dont ces éditions sont déployés. Et Microsoft est également très clair et transparent sur les exceptions, les résumant dans le billet de blog sur le SP1 que j’ai liée dans le troisième paragraphe de ce post.
Microsoft cœur développeurs
Donc, on peut commencer à voir un chemin où les développeurs sur leur Mac et Linux serveurs, habitué à travailler avec gratuit, open source outils, peut aussi le code par rapport à SQL Server et ses aspects les plus avancés, sans que ça coûte de l’argent, et sans avoir besoin d’une machine (même virtuelle) de l’exécution de Windows. Nous n’y sommes pas encore, mais lorsque SQL Server vNext sur Linux, et de la fonctionnalité/politiques d’octroi de licences dans SQL 2016 SP1 convergent, nous serons damnés à proximité.
Comme de longue date de l’écosystème Microsoft professionnel, qui me donne de l’optimisme. À une époque où le travail avec les données en est venu à signifier travailler avec Linux et de l’open source, c’est une bonne tournure des événements.
“R avec vous c’est vraiment un Kafkaïen de l’expérience…”
La même évolution positive s’est produite lorsque Microsoft a décidé de sortir une version Linux de son nuage distribution Hadoop, HDInsight. Cela signifiait que les entreprises de l’écosystème Hadoop, presque tous d’entre eux (y compris mon employeur, Datameer) sont Linux-concentré, pourraient s’associer et d’intégrer avec HDInsight.
Cela a aidé HDInsight devenir un acteur à part entière distribution Hadoop, offrant spécialisé cluster types pas juste pour le générique Hadoop travail, mais aussi pour travailler avec Apache HBase, de l’Orage et de la bougie. Et, juste a annoncé la semaine dernière, un nouveau type cluster pour travailler avec des flux de données orientée Apache Kafka, est en version d’évaluation.
Et quand Microsoft a acquis de la Révolution Analytics, qui sont devenues la principale entité commerciale derrière l’open source R langage de programmation pour les statistiques et l’apprentissage de la machine, c’était trop bon. La société de la Révolution de la R de l’Entreprise (RRE) produit, vend maintenant comme Microsoft R Serveur, est remarquable dans sa capacité à exécuter sur un serveur, ou de l’échelle dans l’ensemble des clusters, de l’exécution dans un système distribué, en mode de base de données, plutôt que de courir autonome sur un PC local ou un Mac.
SQL Server 2016, qui inclut l’intégration de la R la technologie de Serveur sous la forme de SQL Server R Services. Et tandis que ce n’est pas encore partie de SQL Server sur Linux, une autre intégration est basé sur Linux: R Server pour HDInsight, qui est intégré à Apache Spark, en cours d’exécution sur HDInsight. Ce produit a été aperçu depuis un certain temps, et la semaine dernière, est allé dans GA.
L’AG version est à l’écoute de travailler avec Spark 2.0, peuvent accéder aux données stockées dans Apache Hive ou en Parquet format dans HDFS directement, et peut également accéder aux données dans Microsoft HDFS compatible avec le service de stockage appelé Azure Data Lake Magasin (AVQ).
Les données du Lac, et plus
Ce dernier, bien que basée sur Azure Blob Storage, offre encore plus robuste de la tolérance de panne et n’a pas de limite sur la taille des fichiers. Elle aussi a disparu GA, comme a son compagnon de requête de service, d’Azur, à des Données de Lac Analytics (ADLA). La combinaison des AVQ et ADLA vous permettre de faire de Grandes Données de travail à l’aide de U-SQL, SQL comme langage de requête qui est extensible à l’aide de Microsoft .NET et C#. De Plus, ADLA les travaux sont exécutés à la demande, plutôt que d’exiger un cluster dédié, qui apporte une Plate-forme en tant que Service de la sensibilité à Hadoop, qui ADLA s’exécute.
C’est à propos de tout ce qui existe, mais c’est beaucoup. À partir de SQL Server relationnelle de la technologie de R, Hadoop, Spark, Kafka et diverses intégrations entre eux, à la fois sur Windows et sur Linux, Microsoft, si rien d’autre, les données et les analyses de la passion, beaucoup de temps. Lorsque vous ajoutez des choses comme Cognitifs des Services et de la Puissance de la BI en plus de tout cela, Microsoft a un immense, formidable mur de la technologie de transmission de données intégrée, ouverte et multi-plateforme.