Grafico il database di incredibile, ma il knowledge graph è nei dati già. Questo è il messaggio chiave della Sirena è stato sostenendo, e oggi raccolto 10 milioni di dollari in Serie A di finanziamento guidato da Atlantic Ponte per aiutare amplificare il messaggio e di sviluppare la tecnologia. L’investimento comprende anche DVI Equity Partners, Frontline Venture Enterprise Ireland.
Sirena, che dubs stesso investigativa intelligence platform, sviluppato come un ed da grandi quantità di dati e di rappresentazione della conoscenza ricerca dai fondatori Giovanni Tummarello e Renaud Delbru. Come parte di un DVI Equity Partners investimento Sirena è aggiunta veterano del settore, Bob Griffin nel suo Consiglio di Amministrazione.
La Sirena piattaforma fornisce una combinazione di ricerca, business intelligence, big data, link di analisi e di rappresentazione della conoscenza che si dice anticipazioni il modo in cui le organizzazioni a risolvere alcuni dei più importanti al mondo, basato sui dati problemi.
Unificante di Ricerca e Conoscenza Grafici per la vittoria
Tummarello e Delbru iniziato con la ricerca e la conoscenza grafici nel 2007, quando i ricercatori. Conoscenza grafici sono stati ancora una parola di moda, anche se la tecnologia di base (Web Semantico, o i Dati Collegati, o Web di Dati) stava godendo la sua campagna pubblicitaria.
Le pagine Web sono state annotate con bit di metadati: informazioni leggibili a macchina come “autore” o “prezzo”. Questo è stato incorporato in HTML in formati come i microformati o RDF, che sono state poi adottate da Google in Schema.org. Tummarello e Delbru impostato per indicizzare e rendere individuabile in un motore di ricerca per il Web dei Dati chiamato Sindice.
Sindice i contributi di fatto la loro strada attraverso open source di Apache Foundation progetti e motori di ricerca Lucene e Solr prima di piegare. Pur essendo in grado di indicizzare e ricercare un 30 miliardi di bordo knowledge graph è impresa non da poco, la commercializzazione non funzionare al di fuori.
Ma che serviva solo per lanciare Tummarello e Delbru per il loro prossimo progetto: Sirena, il Semantic Information Retrieval Engine. Nel 2014 Sirena fondatori insieme a combinare la Conoscenza Grafici e l’indicizzazione di portare valore all’impresa. Conoscenza Grafici di excel nell’integrazione di varie fonti di dati, e di indice di ricerca è il modo più semplice per accedere ai dati.

Sirena ha un’architettura a più livelli, aiutando a ottenere il meglio di conoscenze grafici, di ricerca e di visualizzazione
Da quel momento, la piattaforma open source Elasticsearch con la sua Kibana visualizzazione livello e ricco ecosistema di plugin è stato un grande successo nella comunità di sviluppatori, ed è stato utilizzato in molte Imprese. Sirena ha deciso di capitalizzare Elasticsearch, offrendo un approccio a più livelli per ottenere il meglio dei due mondi.
Sirena core è di indicizzazione remote origini dati. Nella sua Federazione plugin per Elasticsearch, standard Elasticsearch capacità, sono ulteriormente rafforzata dalla data federation. Remoto fonti dati JDBC sono virtualizzati ed esposti come se fossero gli indici locali, con join spinto verso il basso per il nativo di fonti.
Questa è la strategia Sirena prende per altre origini troppo. Sirena dice che la tecnologia distribuita consente scenari in cui si può eseguire il drill down su query di esprimere la complessità delle relazioni tra i dati da varie fonti, tra cui i registri.
Questo è ciò che consente la Sirena per affrontare quello che si chiama investigativo casi d’uso, che beneficiano di esplorare le connessioni. Per esempio, la scansione di centinaia di milioni di record di dati delle chiamate per trovare risposte a domande come “Quali telefoni telefonate effettuate il lunedì dalle ore 10 alle ore 11 all’interno 10 km di questa posizione e sono a meno di 5 km di questo percorso alle 2 del pomeriggio?”
Edificio di Elasticsearch
Conoscenza grafici senza di ETL (Extract-Transform-Load) processo suona come una proposta interessante. Soprattutto quando accoppiato con la visualizzazione. Sirena segue un approccio simile per il suo front-end, troppo. Esso si basa su Kibana, Elasticsearch dell’interfaccia utente nativa, aggiungendo che cosa chiama “Investigative e di Intelligence”, di funzionalità avanzate.
Sirena aggiunge la possibilità di fare cose come relazionale dei dati di navigazione e di correlazione, link analysis, l’utilizzo dei dati da qualsiasi tipo di sorgente. Ufficialmente supportato sorgenti, PosgreSQL, MySQL, SQL Server, Oracle, Sybase, Presto, Scintilla, Dremio e Impala. Tummarello notato Sirena può anche funzionare con qualsiasi fonte che supporta SQL tramite JDBC, ed è il processo di aggiunta del supporto per il grafico di database come Neo4j.
Come dovrebbe essere evidente, Sirena è in gran parte legato Elasticsearch infrastrutture. Ciò solleva la questione di che cosa è esattamente la natura del loro rapporto, e se la Sirena è in concorrenza con Elasticsearch di un certo livello. Per prima cosa, la Sirena ha anche annunciato il deposito di alcuni brevetti per le Estensioni di Elasticsearch motore.
Come Tummarello chiarito, questi sono 2 prodotti diversi, e ognuno viene fornito con la sua licenza.Sirena ha una community edition, e 2 edizione con diverse funzionalità di chiamata e di Business. Sirena si concentra solo su estensioni per la fascia alta di scenari di dati, ed è infatti in discussioni con Elastico sul modo migliore di collaborare, come essi credono che questo sarà di enormi vantaggi per i nostri clienti, Tummarello ha aggiunto.
Link analysis in Sirena, la connessione a Neo4j
Sebbene core Sirena non è open source, Tummarello anche detto che la Sirena ha contribuito storicamente a Elasticsearch anno su anno, con pull richieste in genere sulle correzioni dei bug o bordi taglienti. Sirena persone anche la speranza di componenti di rilascio che sono compatibili con le ultime versioni di Kibana stack per una maggiore facilità di interazione tra la Sirena e l’Elastico strumenti nativi in un prossimo futuro.
Questo è tutto bene e bene, naturalmente, ma c’è un evidente implicazione. Se si desidera installare la Sirena sulla cima di un commerciale Elasticsearch licenza, che Tummarello detto è l’opzione migliore in quanto Sirena possibile quindi sfruttare un sacco di funzionalità disponibile solo lì, è necessario acquistare la licenza, troppo.
Che significa anche che la Sirena è in un modo dipendente dalla Elasticsearch, non c’è da stupirsi Sirena è prendere in considerazione una qualche forma di collaborazione con Elasticsearch. Che sarebbe in realtà essere una buona cosa per Elasticsearch, troppo: non consentano di raggiungere i clienti con investigativa casi di utilizzo in settori come la Finanza, Scienze della Vita, del Diritto, delle Telecomunicazioni, e per la sicurezza informatica, che sono i settori Sirena di elenchi di clienti tipici.
Trattare con la complessità
L’altra cosa che chiedo su Sirena approccio è il modo veloce e completo è, rispetto ad un grafico database. Tummarello detto Sirena sfrutta grafico database, e che è la bellezza di esso. Egli ha sottolineato, per esempio, come la Sirena può essere utilizzato con Neo4j per shostest percorso o sospetta di modelli di analisi, l’invio di query direttamente al grafico database:
“Quello che stiamo dicendo qui è: un enterprise knowledge graph approccio non è necessario copiare il tutto in un grafico database. Può avere un senso in alcuni casi, in modo che è possibile ottenere le cose come percorso più breve algoritmi di grafico, per gli altri si può lasciare solo i dati di cui è, per esempio, se si desidera semplicemente per navigare”.
L’altra cosa che abbiamo notato, in base a quello che abbiamo visto, è che questo sembra complesso. Vi chiedete come fanno le persone a bordo se stessi e se per loro è facile da usare Sirena, Tummarello notato che analytics per se non è terribilmente semplice. Ha citato Tableau come uno dei più intuitiva e ampiamente utilizzati strumenti di BI, e ha detto che utilizza, o anche, tabelle pivot in Excel, viene fornito con la complessità.
Sirena combina Tableau stile analytics con link di analisi e visualizzazione grafico dell’interfaccia utente e consente agli utenti di porre domande profonde, e che viene fornito con alcune complessità troppo, Tummarello, ha detto. Egli ha sottolineato che, per chi non ha familiarità con Elasticsearch, Sirena è facile da afferrare, e c’è una community edition e della comunità, documentazione, tutorial e corsi di formazione formali nelle opere.
Macchina di apprendimento è un modo per aiutare a trattare con la complessità. Sirena ha recentemente aggiunto ML caratteristiche.
La sirena ha anche ottenuto il bordo con la macchina di apprendimento powered caratteristiche. Sirena 10.3 introdotto Sirena di Machine Learning (Sirena ML). Progettato per utilizzare i moderni open-source apprendimento automatico di framework come TensorFlow e in esecuzione nel cloud-Mobile compatibile ambiente, Sirena ML mira a fornire i dati agli inquirenti un modo per raccogliere i benefici dell’uso di state-of-the-art “auto” macchina-metodi di apprendimento dei propri dati.
Questo è un sacco di digerire. Tummarello detto Sirena è stato in via di sviluppo così veloce che è garantito per avere spigoli qui e là. Ha poi aggiunto, tuttavia, che essi sono impaziente di lavorare con persone che vogliono capire le loro conoscenze grafici, e a migliorare.
Nel 2018, Sirena rialzato di 4 milioni di dollari in finanziamenti seed che le ha consentito di ampliare la propria offerta e target nuovi mercati. Questo $10 milioni di giro può aiutare a Sirena migliorare in più modi, e i risultati dovrebbero essere visibili a breve.
DIVULGAZIONE: Come knowledge graph di esperti, l’autore ha un rapporto commerciale con molte aziende operanti nel settore, tra cui la Sirena. L’autore non ha un palo in Sirena.
Argomenti Correlati:
La Gestione Dei Dati
La Trasformazione Digitale
Robotica
Internet delle Cose
L’innovazione
Enterprise Software