
×
splice-maskine-logo.png
Det er almindelig praksis for database-og analytics-produkter til AI-vaske sig. For eksempel, mange platforme har tilføjet support for at køre Gnist beregne job, og fordi Gnist understøtter ML, de kan gøre, at kravet. Som vi rapporterede om et par år tilbage, Splice Maskine har allerede taget det første skridt ved at integrere Gnist analytics og Zeppelin-notebooks.
Splice Maskinen har nu taget det næste skridt en ny ML Manager-funktion, der giver lifecycle management for machine learning modeller. Det bundter i databasen type af funktionalitet, der ellers ville kræve separate værktøjer som Data Robot, Domino-Data Lab, eller Dataiku. Den nærmeste parallel ville være Cloudera Data Videnskab Workbench, som spiller en lignende rolle i forbindelse med virksomhedens Hadoop platform. Mens det giver modeller, notebooks, og al deres attributter, såsom funktioner og hyperparameters og datakilder til at få sporet, det mangler i øjeblikket nogle af samarbejdet funktioner såsom chat eller kommentering kapaciteter, som mange af tredjeparts-værktøjer giver.
Den stærke punkt i Splejse Maskinens ML Manager er det faktum, at det er bygget oven på databasen, hvilket betyder, at data, der kan indtages uden at skulle til at serialisere det. Efter eksperimenter for at teste forskellige variationer af den model, der er gennemført, Splice Machine ‘ s Gnist-integration gør det nemt at udfylde data i en Gnist DataFrame, der baner vejen for modeller til at køre.
Med sin Gnist integration, der er nogle af de arkitektoniske lighed med Databricks Delta, som virksomheden har for nylig udgivet en ny data-søen kapacitet, der ville gøre opdateringer til Delta transaktionsbeslutning (fx, håndhævelse af SYRE sammenhæng). Men, som det blev påpeget over for os på Twitter efter vores stykke på Databricks delta løb, transaktionen garantier er kun stensikker på HDFS, ikke cloud storage. Splice Machine ‘ s Gnist-integreret analytics kan også køre med data fra HDFS (som HBase løber) eller cloud storage. Forskellen er, at Databricks SYRE garantier kører i batch-mode, mens der for Splejse Maskine, SYRE støtte tilføjer concurrency kontrol på den celle (record) niveau.
Fra get-go, Splice Maskine har differentieret sig fra andre open source-relationel database platforme såsom MariaDB eller PostgreSQL, med rødder i big data. Som en hybrid transaktion/analytisk system, OLTP side løber ud Hadoop er HBase, mens dens analytics-smag kan køre på en række forskellige datakilder, form fil systemer til cloud storage, så længe de data, der er struktureret i formater som Parket. Det har indført sin egen lykkedes database-as-a-service (DBaaS) i AWS og azure, og vi forventer, at der i de næste år, Google Cloud platform vil blive tilføjet til listen.
Splice Maskinens ace i hullet er meget bundet til sin machine learning kapacitet. Accenture har foretaget Splejse Maskine den centrale database for sin AI-platform. Og som en del af Splice-Maskine, Serie B finansiering runde tilbage i februar, Accenture ‘ s venture arm sætte nogle hud i spillet.
Relaterede Emner:
Digital Transformation
Robotteknologi
Tingenes Internet
Innovation
Virksomhedens Software
CXO