In amore con il grafico: Neo4j si diffonde l’ossessione di un nuovo database di un app alla volta

0
10

Come rendere analisi più accessibile a utenti business
Kate Wright, capo della aumentata di business intelligence Hana un’analisi in SAP, spiega Tonya Sala, il processo e l’importanza di strumenti di analisi disponibili per più di solo i dati che gli scienziati.

La maggior parte di software enterprise ha un contingente di fanatici, persone così immersi nella tecnologia che sono convinto che non è l’essere-tutto e la fine di tutto, o quelli che hanno fatto tanti esami di certificazione che tutti sanno. Gli amanti del knowledge graph sembrare un po ‘ più profondo di persuasione.

“Mi sono imbattuto l’idea di guardare al completamento di reti di relazioni, rispetto ai singoli elementi, e sono caduto in amore con l’idea”, dice Amy Hodler, che è il analytics e AI program manager per Neo4j, un 12-anno-vecchio San Francisco di avvio che vende un programma di database con lo stesso nome, in cui gli oggetti per essere contabilizzati sono rappresentati come “nodi” di una rete di grafico, affiancato da “bordi”, che rappresenta la loro conoscenza.

Hodler, che non è semplicemente un fan della sua azienda, lei è un appassionato di tutte le cose di grafica, come ad esempio scrivere il grafico studioso Albert-Laszlo Barabasi — “ho tutti i suoi libri” — e più popolari nomi come James Fowler, che ha scritto Il New York Times bestseller Collegato (“è un grande libro.”)

hetionet-exploration-sept-13-2019.png

Un esempio grafico conoscenza di esplorazione da Hetionet, un’applicazione creata utilizzando Neo4j da UC San Francisco studente laureato Daniel Himmelstein.

(Immagine: Himmelstein et al.)

Amare il grafico, lei sostiene, per vedere qualcosa che gli altri non lo fanno. “Si può sapere tutto su di un corvo in volo, ma non in un gregge di pecore”, dice Hodler.

C’è un punto a questa passione in un mondo ancora evangelizzata. Grafico database, non hanno ancora preso il sopravvento. Il database relazionale ancora di gran lunga le regole del posatoio. E ci sono tutti i tipi di altri archivi di dati, sempre di più per i vari tipi di dati non strutturati, tra cui Hadoop e il “No-SQL” folla.

neo4j-amy-hodler-2019.jpg

Amy Hodler, che è il analytics e AI program manager per Neo4j, inciampato sulla teoria dei grafi e grafico database, mentre la pratica di analytics. Lei crede che permette di vedere in modi diversi.

(Immagine: Neo4j)

Ma la folla che ha costruito Neo4j sembra di aver fatto progressi dall’entusiasmo, a partire da un’intuizione e, forse, un po ‘ di ingenuità.

“Eravamo giovani e stupidi basta dire:” cerchiamo di costruire un database, come può essere difficile,” dice Emil Eifrem, fondatore e CEO di Neo4j. Lui e i colleghi inciampato su l’idea, quando era in servizio come CTO, fresco di laurea, per un svedese tech startup, Windh Tecnologie. Qualcosa non era un clic con l’utilizzo di database relazionale per un sistema di gestione dei contenuti.

“Ero stato in programmazione per metà della mia vita a quel punto,” riflette “e, in ogni progetto, il database era un aiuto, un acceleratore, un qualcosa che si è preso cura di roba per me, ma per qualche ragione, è stato e ci rallentano quella volta.”

E ‘ diventato chiaro, egli dice, che c’è stato un “mismatch” tra i dati e relazionale struttura di dati del Oracle e Informix. Un enterprise content management system, spiega Eifrem, è come un grande sistema di file sul World Wide Web, con cartelle all’interno di cartelle e collegamenti simbolici tra di loro, “un sacco di dati connessi”, come dice lui. La riga e la colonna della struttura di un database relazionale, con la sua “join” operazioni e simili, non è tagliato.

Anche: i Big data in azione: Utilizzo di graph database di auto nuove opinioni dei clienti

Quello che lui e i colleghi iniziato a costruire propria, quella che sarebbe diventata la base di una società, è un database che può “modello di tutto”, Eifrem insiste, con “tre semplici blocchi di costruzione: Nodi, una rappresentazione di un oggetto o di un’entità giuridica; i bordi, le linee che collegano nodi a un altro; e “le coppie chiave/valore,” di simboli, archiviare e recuperare le cose.

Che non sapevo allora, ma un po ‘ di compagnia che si chiama Google stava già facendo fieno con questo approccio, il “PageRank” algoritmo che sarebbe diventata la base del mondo, il più grande motore di ricerca. Eifrem sostiene che la conoscenza centrale dietro PageRank, ciò che viene chiamato “autovettore centralità,” è una sorta di parentela tra Google e tutti gli altri che perseguono la conoscenza di grafici, tra cui Neo4j.

“Il fatto che essi connessi dati, che è quello che facciamo, prendiamo il potere che ha creato quasi un trilione di dollari in capitalizzazione di mercato, e applichiamo il classico enterprise casi, cose come il rilevamento delle frodi e la raccomandazione di motori.” Eifrem sostiene che le “grandi aziende del Web” come Google trattasse di una sorta di prima ondata di knowledge graph, seguiti da enterprise utilizzo dell’applicazione con Neo4j, e una terza ondata che è appena emergenti, utilizzando il grafico di assistere di machine learning e di altre intelligenza artificiale approcci.

Anche: Grafico database reinventato: Dgraph fissa $11.5 M a perseguire il suo unico e supponente percorso

Anche se è ancora un mercato piccolo, semplice, elegante, paradigma di un grafico che mostra le relazioni crea nuovi fan ogni volta che si presenta in un’applicazione. C’è qualche alto profilo per le applicazioni già. Per esempio, Daniel Himmelstein, poi lavorare come uno studente laureato presso la UC San Francisco, creato un database di genetica e molecolare delle interazioni, chiamato “Hetionet,” biologico rete di informazione che può essere utilizzato per studiare le possibili combinazioni di farmaci. La sua conoscenza di nodi e bordi produce spettacolari grafici di dati come quello qui sotto.

project-rephetio-interaction-illustration.png

Un’illustrazione di gene e composto farmacologiche in biologia presso l’carta “Rete Eterogenea Bordo di Stima: Un Approccio di Integrazione di Dati per dare la Priorità Associata a Malattia Geni” di Daniel S. Himmelstein e Sergio E. Baranzini. Utilizzando Neo4j, Himmelstein costruito il sistema di collegamenti graficamente traccia e rappresentano le interazioni che possono avere attinenza con la malattia e le cure.

(Immagine: Himmelstein et al.)

Tra i convertiti sono alcuni dei più alto profilo giovani aziende, di cui il concerto di economia vestito Lyft. Più di tre mesi, project manager Mark Grover e un team di quattro ingegneri e designer sono stati in grado di mettere insieme una versione iniziale di un repository di metadati, chiamato “Amundsen”, utilizzando Neo4j.

Se siete interessati a leggere il progetto, Grover e la squadra hanno messo su un post di un blog; il codice è pubblicato su Github.

Che non producono necessariamente licenza di vendita in ogni caso, ma contribuisce a conquistare i cuori e le menti. La comprensione e l’adozione del grafico emerge in più punti. Google DeepMind, per esempio, sta esplorando i modi in cui il grafico può servire come un mezzo per l’inserimento di “strutturato rappresentazioni”, in profonda apprendimento delle reti neurali. Che possono rendere più sofisticata IA capacità di costruire inferenze da un insieme di blocchi di costruzione.”

Per il Neo4j gente, questo è il costante progresso della logica inflessibile del grafico.

“Penso che sia un cambiamento di pensiero, in movimento a graph database, dice analytics veep Hodler. “Si verifica questo, come si inizia a guardare i grafici.” Confessa di avere “un tempo più facile spiegare i grafici non tecnologi” rispetto a un ingegnere spiegare, dire, “in terza forma normale” di un RDBMS per la persona media.

CEO Eifrem è ancora più enfatizzato in paragonando il grafico a qualcosa che suona come il destino.

“AltaVista visto in bianco e nero, e Google visto in colore”, dice il motore di ricerca battaglie di un tempo. Allo stesso modo, ci sono un sacco di cose connesse nel mio mondo che non ero in grado di operare perché i miei strumenti sono stati riportarmi indietro; ora ho semplicemente messo in Neo4j, e posso fare tutta quella roba buona.”

“È solo una questione di tempo”, dice.

I Big Data

No, questo l’IA non sa ottavo grado della scienza

Dal basso codice e cloud, per l’IA e la crittografia: Cosa si può fare con i dati deve essere qualcosa di più che parole

La domanda di AI per ServiceNow, è una questione di ciò che funziona

Come il MIT sta cercando di risolvere AI bias (ZDNet YouTube)

Facebook ha un nuovo strumento di privacy per proteggere i vostri dati (CNET)

5 modi Ceo può costruire un resiliente, data-driven organization (TechRepublic)

Argomenti Correlati:

La Gestione Dei Dati

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software