Graf databaser er fantastisk, men den viden grafen i dine data, de allerede har. Det er det centrale budskab Sirenen har været fortaler for, og er i dag rejst $10 millioner i Serie A, finansiering ledet af Atlanten Bro til at hjælpe med at forstærke budskabet og udvikle teknologien. Investeringen omfatter også DVI Equity Partners, Frontline Ventures og Enterprise Ireland.
Sirenen, der kalder sig selv den undersøgende intelligence platform, der er udviklet som et spinout fra big data og viden repræsentation forskning af grundlæggerne Giovanni Tummarello og Renaud Delbru. Som en del af DVI Equity Partners investering Sirenen er at tilføje industri veteran Bob Griffin i sin Bestyrelse.
Sirenen platform giver en kombination af søgning, business intelligence, big data, link analyse af og viden repræsentation, som det siger, at fremskridt på den måde, organisationer løse nogle af verdens mest vigtige data drevet problemer.
Samlende Søg og Viden Grafer for at vinde
Tummarello og Delbru kom i gang med at søge og viden grafer tilbage i 2007, som forskere. Viden grafer ikke var endnu et buzzword, selv om den underliggende teknologi (Semantiske Web, eller Sammenkædede Data, eller Web af Data) blev nyder sin egen hype.
Web-sider blev kommenteret med stumper af metadata: maskinlæsbare oplysninger som “forfatter” eller “pris”. Dette var indlejret i HTML-i formater som mikroformater eller RDF, som derefter blev vedtaget af Google i Schema.org. Tummarello og Delbru sat sig for at indeksere dem og gøre dem søgbar i en søgemaskine for Web af Data kaldes Sindice.
Sindice ‘ s bidrag til open source Apache Foundation-projekter og søgemaskiner Lucene-og Solr før foldning. Selv om de er i stand til at indeksere og søge i en 30 milliarder kant knowledge graph er ikke nogen lille bedrift, kommercialisering ikke helt finde ud af.
Men at der kun tjente til at lancere Tummarello og Delbru til deres næste bestræber: Sirene, at den Semantiske Information Retrieval Motor. I 2014 Siren ‘ s grundlæggere afsted for at kombinere Viden Grafer og indeksering for at bringe værdi til virksomheden. Viden Grafer i excel integration af forskellige datakilder, og indeks-baseret søgning er den nemmeste måde at få adgang til disse data.

Sirene har en lagdelt arkitektur, hjælpe til med at få det bedste ud af viden grafer, søgning og visualisering
På det tidspunkt, open source platform Elasticsearch med sin Kibana visualisering lag og rige plugin økosystem var et stort hit i udvikler-community, og det blev brugt i mange Virksomheder. Sirene besluttet at udnytte Elasticsearch, ved at tilbyde en lagdelt tilgang til at få det bedste af begge verdener.
Sirene ‘ s kernen er indeksering eksterne datakilder. I sin Tilslutte plugin til Elasticsearch, standard Elasticsearch kapaciteter er yderligere forstærket af data føderation. Remote JDBC datasources er virtualiseret og udsat, som hvis de var lokale indeks, med samlinger skubbet ned til de oprindelige kilder.
Dette er strategi Sirene tager for andre datasources også. Sirene siger fordelt teknologi gør det muligt scenarier, hvor man kan bore ned på forespørgsler udtrykke komplekse relationer på tværs af data fra forskellige kilder, herunder logfiler.
Dette er, hvad gør Sirene til at løse, hvad det kræver, undersøgende brug sager, som med fordel udforske forbindelser. For eksempel, scanning hundredvis af millioner af daglige opkald data registre for at finde svar på spørgsmål som “hvilke telefoner Der er foretaget opkald på mandage fra 10 til 11 inden for 10 km af dette sted og var inden for 5 km af denne anden placering på 2pm?”
Bygning på Elasticsearch
Viden grafer uden ETL (Extract-Transform-Load) proces, der lyder som et attraktivt tilbud. Især når kombineret med visualisering. Sirene følger en lignende tilgang til sin front-end, også. Det bygger på Kibana, Elasticsearch native UI, tilføje, hvad den kalder “Undersøgende Intelligens” avancerede funktioner.
Sirene tilføjer evnen til at gøre ting, såsom relationelle data navigation og korrelation og link analyse, der arbejder med data fra enhver form for kilde. Officielt understøttede kilder omfatter PosgreSQL, MySQL, SQL Server, Oracle, Sybase, Presto, Spark, Dremio og Impala. Tummarello bemærkes Sirenen kan også arbejde med en hvilken som helst kilde, der understøtter SQL via JDBC, og er i færd med at tilføje støtte til grafen databaser som Neo4j.
Som bør være klart, Sirene i vid udstrækning bygger på Elasticsearch infrastruktur. Dette rejser spørgsmålet om, hvad der er den nøjagtige karakter af deres forhold, og om Sirene konkurrerer med Elasticsearch på nogle niveau. For én ting, Sirene også annonceret at indgive nogle patenter til Udvidelser af Elasticsearch motor.
Som Tummarello afklaret, det er 2 forskellige produkter, og hver kommer med sin egen licens.Sirene har en gratis community edition, og 2 udgave med forskellige kapaciteter, der hedder It og Forretning. Sirene kun fokuserer på udvidelser til høje ende af data scenarier, og er i virkeligheden i diskussioner med Elastik om, hvordan man bedst samarbejder, som de mener, at dette vil være til stor fordel for vores kunder, Tummarello gik på at tilføje.
Link analyse i Sirene, tilslutning til Neo4j
Selv om kernen Sirenen er ikke open source, Tummarello sagde også, Sirene har været at bidrage historisk Elasticsearch år over år, med træk anmodninger typisk om fejlrettelser eller skarpe kanter. Sirene folk håber også, at frigive komponenter, der er kompatible med de nyeste versioner af Kibana stak for øget lethed af samspillet mellem Sirene, og den Elastiske native-værktøjer i den nærmeste fremtid.
Det er alt sammen fint og godt, selvfølgelig, men der er en indlysende konsekvenser. Hvis du ønsker at installere Sirene på toppen af en kommerciel Elasticsearch licens, som Tummarello sagt, er den bedste mulighed, da Sirenen kan derefter udnytte en masse af de funktioner, der kun er tilgængelige i der, er du nødt til at købe licensen, også.
Det betyder også, at Sirenen er på en måde afhængige af Elasticsearch, så ingen spekulerer på, Sirene, overvejer nogle måde at arbejde med Elasticsearch. Det ville faktisk være en god ting for Elasticsearch, for det ville gøre det muligt at nå ud til kunder med undersøgende use cases inden for brancher som Finansiering, Life Sciences, Lov, Teleselskaber, og Cybersikkerhed, som er de brancher, Sirene lister, som typisk kunder.
Beskæftiger sig med kompleksiteten
Den anden ting at undre sig over Sirene ‘ s tilgang er, hvordan hurtig og full-featured det er, i forhold til en graf-database. Tummarello sagde Sirene udnytter graf databaser, og det er skønheden i det. Han påpegede for eksempel, hvordan Sirenen kan bruges med Neo4j for shostest vej til eller mistanke om mønstre analyse, sende forespørgsler direkte til graph database:
“Det vi siger her er: for en virksomhed, viden graf tilgang, behøver du ikke at kopiere det hele ind i en grafdatabase. Det kan give mening i visse tilfælde, så du får ting som korteste vej graf algoritmer, for andre, kan du bare lade data, hvor det er, for eksempel, hvis du blot ønsker at navigere”.
Den anden ting vi bemærkede, baseret på hvad vi har set, er, at det ser kompliceret. Spekulerer på, hvordan folk ombord på sig selv, og om de finder det let at bruge Sirene, Tummarello bemærkes, at analytics ikke i sig selv er ikke særlig let. Han nævnte Tableau som en af de mest intuitive og udbredte BI-værktøjer, og sagde, at bruge dette, eller endda pivot-tabeller i Excel, kommer med kompleksitet.
Sirene kombinerer Tableau stil analytics med link analyse og en graf visualisering UI, og giver brugerne mulighed for at stille dybe spørgsmål, og der kommer med nogle kompleksitet for, Tummarello sagde. Han påpegede, at for mennesker er bekendt med Elasticsearch, Sirene, er let at forstå, og der er et community edition og fællesskabets hjælp, dokumentation, vejledninger, og formel uddannelse i værkerne.
Machine learning er en måde at hjælpe med at håndtere kompleksitet. Sirenen har for nylig tilføjet ML funktioner.
Sirenen har også fået om bord med machine learning drevet funktioner. Sirene 10.3 indført Sirene Machine Learning (Siren ML). Designet til at udnytte moderne open source-machine-learning rammer såsom TensorFlow og kører i cloud-kompatibel Lader miljø, Sirene ML har til formål at levere data, undersøgere med en måde at høste fordelene ved at bruge state-of-the-art “auto” machine-learning metoder på deres data.
Der er en masse at fordøje. Tummarello sagde Sirenen har udviklet sig så hurtigt, at det er garanteret at have skarpe kanter her og der. Han fortsatte med at tilføje, dog, at de ser frem til at arbejde med mennesker, der ønsker at forstå deres viden grafer, og på at forbedre.
I 2018, Sirene rejst $4 millioner i startkapital, som har gjort det muligt at udvide sit udbud og fokusere på nye markeder. Denne $10 millioner runde kan hjælpe Sirene forbedre sig på flere måder, og resultaterne skal være synlige snart.
OFFENTLIGGØRELSE: Som en viden graf ekspert, forfatteren har en forretningsforbindelse med mange virksomheder, der er aktive på området, herunder Sirene. Forfatteren har ikke en indsats i Sirene.
Relaterede Emner:
Data Management
Digital Transformation
Robotteknologi
Tingenes Internet
Innovation
Virksomhedens Software