Skarva Maskinen dubblar ner på att hantera maskinen lärande

0
176
splice-machine-logo.png

×

skarv-maskin-logotyp.png

Det är vanligt för databas-och analytics-produkter till AI-tvätta av sig. Till exempel, många plattformar har stöd för att köra Spark beräkna jobb, och eftersom Gnista stöder ML, de kan göra detta påstående. Som vi rapporterade för ett par år tillbaka, Skarv Maskinen har redan tagit de första stegen genom att integrera Gnista analytics och Zeppelin bärbara datorer.

Skarva Maskinen har nu tagit nästa steg en ny ML Manager-funktionen som ger lifecycle management för modeller. Det buntar i databasen för typ av funktionalitet som annars skulle kräva ett separat verktyg som Data Robot, Domino Data Lab, eller Dataiku. Den närmaste parallellt skulle vara Cloudera Data Vetenskap Workbench, som spelar en liknande roll med bolagets Hadoop plattform. Även om det låter modeller, bärbara datorer, och al attribut såsom egenskaper och hyperparameters och datakällor för att få spåras, det för närvarande saknar en del av samarbetet funktioner som chatt eller anteckning kapacitet att många av de verktyg från tredje part tillhandahåller.

De starka led av Skarv Maskinens ML Manager är det faktum att den är byggd ovanpå den databas, vilket innebär att data kan intas utan att serialisera det. Efter experiment att testa olika varianter av modellen är klar, Skarv Maskinens Gnista integration som gör det enkelt att fylla i data i en Gnista DataFrame, som banar väg för de modeller för att köras.

Med sin Spark integration, det finns några arkitektoniska likheter med Databricks Delta, som företaget nyligen öppen källkod med en ny data sjön kapacitet som skulle göra uppdateringar att Delta affärsbeslut (t ex, upprätthålla SYRA konsekvens). Men, som pekade ut oss på Twitter efter vår pjäs på Databricks delta sprang transaktionen garantier är bara ironclad på HDFS, inte moln lagring. Skarva Maskinens Spark-integrerad analytics kan också köra med data från HDFS (som HBase springer) eller moln lagring. Skillnaden är att Databricks SYRA garantier köra i batch-läge, medan det för Skarv Maskinen, SYRA stöd till samtidig kontroll på den cell (posten) nivå.

Från get-go, Skarv Maskinen skiljer sig från andra open source-relationsdatabas plattformar som MariaDB eller PostgreSQL med sina rötter i big data. Som en hybrid transaktion/analys-system, OLTP sidan rinner av Hadoop HBase, medan analytics smak kan köras på en mängd olika datakällor, form file system till moln lagring, så länge som data är i ett strukturerat format som Parkett. Det har infört sin egen lyckats databas-as-a-service (DBaaS) i AWS och azure, och vi räknar med att under nästa år, Google Cloud-plattformen kommer att läggas till i listan.

Skarva Maskinen har ett ess i hålet är mycket bunden till sin maskin lärande förmåga. Accenture har gjort Skarva Maskin den centrala databasen för sin AI-plattformen. Och som en del av Skarv Maskin B-finansiering runda tillbaka i februari, Accenture satsning på arm sätta lite hud i spelet.

Relaterade Ämnen:

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem

CXO