Vill upptäcka den kunskap diagram i företagets data? Siren säkrade bara $10 Miljoner för att hjälpa till att göra det

0
205

Grafdatabaser är fantastiska, men kunskapen grafen i dina uppgifter redan. Det är det viktigaste budskapet Siren har förespråkat, och idag är det upp $10 miljoner i Serie A finansiering leds av Atlanten Bro för att förstärka budskapet och utveckla tekniken. I investeringen ingår även DVI Equity Partners, Frontline Ventures och Enterprise Ireland.

Siren, som dubs sig den undersökande intelligence-plattform, som utvecklats som en spinout från big data och kunskap representation forskning av grundarna Giovanni Tummarello och Renaud Delbru. Som en del av DVI-Equity Partners investeringar Siren är att lägga till industrin veteran Bir Griffin i sin Styrelse.

Siren-plattformen erbjuder en kombination av sök, business intelligence och big data, länk analys och kunskap representation som det står förskott sättet som organisationer itu med några av världens viktigaste uppgifter som drivs problem.

Unifying-Sök och Kunskap Grafer för att vinna

Tummarello och Delbru började med sök och kunskap graphs tillbaka i 2007 som forskare. Kunskap diagram har ännu inte ett modeord, även om den underliggande tekniken (den Semantiska Webben, eller Länkad Data, eller Web of Data) var njuter av sin egen hype.

Webbsidor var uppmärkta med bitar av metadata: maskinläsbar information som “författare” eller “pris”. Detta var inbäddade i HTML-format som mikroformat eller RDF, som sedan antogs av Google Schema.org. Tummarello och Delbru ut för att indexera dem och distribuera dem i en sökmotor för Webben av Data kallas Sindice.

Sindice bidrag gjort sin väg genom öppen källkod Apache Foundation-projekt och sökmotorer Lucene och Solr före falsning. Även om att kunna indexera och söka en 30 miljarder kanten knowledge graph är ingen liten bedrift, kommersialisering inte riktigt räkna ut.

Men som bara tjänat till att starta Tummarello och Delbru att deras nästa strävan: Siren, den Semantiska Information Retrieval Motor. 2014 Siren: s grundare av att kombinera Kunskap Grafer och indexering för att skapa värde för företaget. Kunskap Diagram excel i att integrera olika datakällor, och index-baserad sökning är det enklaste sättet att få tillgång till dessa uppgifter.

sirenarchitecture.png

Siren har en skiktad arkitektur, hjälpa till att få det bästa av kunskap grafer, sökning och visualisering

Med en open source-plattform Elasticsearch med sin Kibana visualisering lager och rik plugin-ekosystemet var en stor hit på utvecklare, och det har använts i många Företag. Siren beslutat att kapitalisera på Elasticsearch, genom att erbjuda ett lager tillvägagångssätt för att få det bästa av båda världar.

Siren: s kärna är indexering remote data källor. I sitt Användande plugin för Elasticsearch, standard Elasticsearch kapacitet förstärks ytterligare av data federation. Avlägsna JDBC datasources är virtualiserade och utsatta som om de vore lokala index, med kopplingar pressade ned den inhemska källor.

Detta är den strategi Siren tar för andra datasources också. Siren säger distribuerad teknik gör det möjligt att scenarier där man kan borra ned på frågor att uttrycka komplexa relationer mellan data från olika källor, inklusive loggar.

Detta är vad som gör att Sirenen att ta itu med vad man kallar undersökande användningsfall, att dra nytta av att utforska anslutningar. Till exempel, skanning hundratals miljoner dagliga samtal data register för att hitta svar på frågor som “Vilka telefoner samtal på måndagar klockan 10 till 11 inom 10km på denna plats och var inom 5 km från denna andra plats vid 2pm?”

Byggnad på Elasticsearch

Kunskap grafer utan att ETL (Extract-Transform-Load) process låter som ett attraktivt erbjudande. Speciellt när den kombineras med visualisering. Siren följer en liknande strategi för sin front-end också. Det bygger på Kibana, Elasticsearch är infödda UI, lägga till vad man kallar “Undersökande Intelligens” avancerade funktioner.

Siren ger möjlighet att göra saker som relationell data, navigering och korrelation och länka analys, som arbetar med data från alla typer av källor. Officiellt stöds källor är PosgreSQL, MySQL, SQL Server, Oracle, Sybase, Presto, Spark, Dremio och Impala. Tummarello noteras Siren kan också arbeta med någon källa som stöder SQL via JDBC, och är i processen av att lägga till stöd för grafdatabaser som Neo4j.

Som borde vara uppenbart, Siren till stor del förlitar sig på Elasticsearch infrastruktur. Detta väcker frågan vad som är den exakta arten av deras relation, och om Siren konkurrerar med Elasticsearch på en viss nivå. För en sak, Siren meddelade också lämna in vissa patent för Tillägg av Elasticsearch motor.

Som Tummarello förtydligas, dessa är 2 olika produkter, och var och en kommer med sin egen licens.Siren har en gratis community edition, och 2 edition med olika kapacitet heter Det och Företag. Siren bara fokuserar på tillägg för high-end data scenarier, och är i själva verket i diskussioner med Resår på hur man bäst kan samarbeta, eftersom de tror att detta kommer att vara av stor nytta för våra kunder, Tummarello gick att lägga till.

siren-and-neo4j-link-analysis-1200x631-1-1-800x421.png

Länk analys i Siren, ansluta till Neo4j

Även om kärnan Siren är inte open source, Tummarello sade också Siren har varit att bidra historiskt att Elasticsearch år över år, med pull önskemål typiskt om buggfixar eller vassa kanter. Siren människor hoppas också att släppa komponenter som är kompatibla med de senaste versionerna av de Kibana stacken för att öka och förenkla samverkan mellan Siren och Elastisk native verktyg i den nära framtiden.

Detta är alla fina och väl, naturligtvis, men det är en självklar innebörd. Om du vill installera Siren på toppen av en kommersiell Elasticsearch licens, som Tummarello sagt är det bästa alternativet som Siren kan då utnyttja en hel del av de funktioner som bara är tillgängliga i det, du har för att köpa denna licens också.

Det innebär också att Siren är på ett sätt beroende på Elasticsearch, så inte undra på Siren är att betrakta några sätt att arbeta med Elasticsearch. Som faktiskt skulle vara en bra sak för Elasticsearch också: det skulle göra det möjligt att nå kunder med undersökande använd fall i branscher som Finans, Life Sciences, Law, Teleoperatörer och It-säkerhet, som är de branscher Siren listor som typiska kunder.

Hantera komplexitet

Den andra sak att fundera över Siren: s strategi är hur snabbt och fullfjädrad det är, jämfört med en grafdatabas. Tummarello sade Siren utnyttjar grafdatabaser, och det är skönheten i det. Han påpekade till exempel hur Sirenen kan användas med Neo4j för shostest väg eller misstänkta mönster analys, skicka frågor direkt till grafdatabas:

“Vad vi säger här är att: för ett företag knowledge graph strategi du behöver inte kopiera allt i en grafdatabas. Det kan vara meningsfullt i vissa fall, så får du saker som kortaste vägen grafen algoritmer, för andra kan du bara lämna uppgifter om var det är, till exempel om du bara vill navigera”.

En annan sak noterade vi, baserat på vad vi sett, är att det här ser komplex. Undrar på hur människor ombord på sig och om de tycker att det är lätt att använda Siren, Tummarello noteras att analytics per se är inte särskilt lätt. Han nämnde Tablån som en av de mest intuitiva och används flitigt BI-verktyg, och sade med den, eller ens pivot-tabeller i Excel, kommer med komplexitet.

Siren kombinerar Tablån stil analytics med länk analys och en graf visualisering UI och gör det möjligt för användare att ställa djupa frågor, och som kommer med viss komplexitet också, Tummarello sagt. Han påpekade att för personer som är bekanta med Elasticsearch, Siren är lätt att förstå, och det är en community edition och hjälp, dokumentation, tutorials, och formell utbildning i de fungerar.

sirenml.png

Maskininlärning är ett sätt att hantera komplexitet. Siren har nyligen lagt till ML har.

Siren har också fått ombord med machine learning powered funktioner. Siren 10.3 infördes Siren Machine Learning (Siren ML). Syftar till att utnyttja modern öppen källkod machine-learning ramar som TensorFlow och körs i molnet-kompatibel Docker miljö, Siren ML syftar till att ge uppgifter utredare med ett sätt att dra nytta av med hjälp av state-of-the-art “auto” – maskin-lärande metoder på sina data.

Det är mycket att smälta. Tummarello sade Siren har utvecklats så snabbt att det är garanterat att ha grova kanter här och där. Han fortsatte med att lägga, men att de ser fram emot att arbeta med människor som vill förstå sin kunskap grafer, och för att förbättra.

2018, Siren höjs med $4 miljoner i startkapital som har gjort det möjligt att utöka sitt erbjudande och mål på nya marknader. Denna $10 miljoner runda kan hjälpa Siren förbättra på flera sätt, och resultaten bör vara synlig snart.

UPPLYSNINGAR: Som en knowledge graph-expert, författaren har en affärsrelation med många företag som är verksamma i området, inklusive Siren. Författaren har inte en insats i Sirenen.

Relaterade Ämnen:

Hantering Av Data

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem