Splice Machine verdubbelt op het beheer van machine learning

0
139
splice-machine-logo.png

×

las-machine-logo.png

Is het gebruikelijk dat je voor de database-en analytics-producten naar AI-zich wassen. Bijvoorbeeld, veel platforms hebben ondersteuning toegevoegd voor het uitvoeren van Spark berekenen van banen, en omdat Spark ondersteunt ML, ze kunnen dat de claim. Als we melding maken van een paar jaar terug, Las Machine heeft al de eerste stappen genomen door de integratie van Spark analytics en Zeppelin notebooks.

Splice Machine heeft nu de volgende stap gezet van een nieuwe ML Manager functie die zorgt voor beheer van levenscyclus voor machine learning modellen. Deze bundels in de database het type van de functionaliteit die anders zouden vereisen afzonderlijke tools zoals Gegevens Robot, Domino Data Lab, of Dataiku. De dichtstbijzijnde parallelle zou worden Cloudera de Gegevens van de Wetenschap Werkbank, die speelt een vergelijkbare rol met de Hadoop-platform. Tijdens het laat-modellen, notebooks, en al hun attributen, zoals functies en hyperparameters en gegevensbronnen te krijgen bijgehouden, is het op dit moment ontbreekt een aantal van de functies voor samenwerking, zoals chatten of annotatie mogelijkheden die veel van de programma ‘ s van derden verstrekt.

Het sterke punt van Splice Machine ML Manager is het feit dat het is gebouwd op de top van de database, wat betekent dat de gegevens kunnen worden ingeslikt zonder te serialiseren. Na experimenten met het testen van verschillende varianten van het model zijn ingevuld, Las Machine Vonk integratie maakt het eenvoudig om gegevens ingevuld in een Vonk DataFrame, de weg vrijmaakt voor de modellen worden uitgevoerd.

Met de Vonk, de integratie, is er een aantal architectonische gelijkenis met Databricks Delta, die het bedrijf onlangs open source met een nieuwe data meer vermogen, dat zou updates van Delta transactie (bijvoorbeeld, de handhaving van het ZUUR consistentie). Maar, zo werd gewezen ons op Twitter na ons stukje over Databricks delta liep, de transactie garanties zijn enkel van ironclad op HDFS, geen opslag in de cloud. Splice Machine Spark-geïntegreerde analytics kan ook worden uitgevoerd met de gegevens van HDFS (op die HBase wordt uitgevoerd) of cloud storage. Het verschil is dat Databricks ZUUR garanties worden uitgevoerd in batch-modus, terwijl voor Splice Machine, het ZUUR ondersteuning voegt concurrency control op de cel (record) niveau.

Vanaf de get-go, Las Machine onderscheidt zich van andere open source relationele database platforms zoals MariaDB of PostgreSQL met haar wortels in de big data. Als een hybride transactie/analyse systeem, de OLTP kant loopt uit Hadoop is HBase, terwijl de google analytics smaak kan draaien op een verscheidenheid van gegevensbronnen, vorm bestandssystemen naar opslag in de cloud, zolang de gegevens in gestructureerde indeling zoals Parket. Het heeft een eigen managed database-as-a-service (DBaaS) AWS en azure, en we verwachten dat in het komende jaar, Google Cloud platform wordt toegevoegd aan de lijst.

Splice Machine ace in the hole is heel erg gebonden aan de machine learning mogelijkheden. Accenture heeft gemaakt Splice Machine de kern-database voor de AI-platform. En als onderdeel van Splice Machine van de Serie B financiering ronde in februari, Accenture ‘ s venture arm zetten huid op het spel.

Verwante Onderwerpen:

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software

CXO