I kærlighed med grafen: Neo4j spreder besættelse af en ny database, en app på et tidspunkt

0
163

Hvordan til at gøre analytics mere tilgængelig for den almindelige virksomhed bruger
Kate Wright, chef for augmented business intelligence Hana en Analytics på SAP, forklarer, at Tonya Hall processen og vigtigheden af at gøre analytics til rådighed for mere end bare data forskere.

De fleste enterprise software har et korps af fanatikere, folk er så gennemsyret af den teknologi, som de er overbevist om, at det er alfa og omega, eller dem, der har taget så mange certificering eksamener, at det er alle de kender. Elskere af den viden grafen synes en smule dybere form af overtalelse.

“Jeg snuble på den idé, at se på komplet netværk af relationer, i modsætning til de enkelte elementer, og jeg faldt i kærlighed med den idé,” siger Amy Hodler, der er analytics og AI program manager for Neo4j, en 12-årig San Francisco start, der sælger en database program af samme navn, i hvilke objekter der skal være regnskabsmæssigt er repræsenteret som “noder” i en net-graf, følgeskab af “kanter”, der repræsenterer deres bekendtskab.

Hodler ikke blot er en fan af hendes virksomheds arbejde, hun er en aficionado af alle grafiske ting, som skrivning af grafen videnskabsmand Albert-László Barabasi — “jeg har alle hans bøger” — og mere populære navne, såsom James Fowler, der skrev New York Times bestseller Tilsluttet (“det er en fantastisk bog.”)

hetionet-exploration-sept-13-2019.png

Et eksempel viden graf udforskning fra Hetionet, et program, der er oprettet ved hjælp Neo4j ved UC San Francisco ph.d. – studerende Daniel Himmelstein.

(Billede: Himmelstein et al.)

At elske grafen er, at hun argumenterer for, at se noget andre ikke kan. “Du kan vide alt om en krage flyvende, men du ville ikke vide en flok,” siger Hodler.

Der er en pointe at en sådan lidenskab i en verden, der stadig bliver evangeliseret. Graf databaser, der endnu ikke har taget over. Den relationelle database er stadig enormt regler roost. Og der er alle mulige andre data butikker, i stigende grad af forskellige typer af ustrukturerede data, herunder Hadoop og “No-SQL” crowd.

neo4j-amy-hodler-2019.jpg

Amy Hodler, der er analytics og AI program manager for Neo4j, snublede på grafteori og graf databaser, samtidig med at praktisere analytics. Hun mener, at det gør det muligt at se på forskellige måder.

(Billede: Neo4j)

Men mængden, der er bygget Neo4j synes at have udviklet sig med begejstring, startende fra den indsigt og måske en smule naivitet.

“Vi var unge og dum nok til at sige, lad os bygge en database, hvor svært kan det være”, siger Emil Eifrem, grundlægger og CEO for Neo4j. Han og kolleger stødte på ideen, da han var ansat som CTO, frisk ud af college, for en svensk tech startup, Windh Teknologier. Noget var bare ikke at klikke med brug af den relationelle database for et content management system.

“Jeg havde været programmering i halvdelen af mit liv på det tidspunkt,” han reflekterer, “og i hvert enkelt projekt, database havde været en hjælp, en accelerator, noget, der tog sig af ting for mig, men for nogle grund, det var langsommere os ned denne gang.”

Det blev klart, siger han, at der var et “mismatch” mellem data og relationel data struktur Oracle og Informix. En enterprise content management-system, forklarer Eifrem, er ligesom en stor fil system på World Wide Web, med mapper i mapper, og symbolske links mellem dem, “en masse af forbundne data,” som han udtrykker det. Den række og kolonne struktur af en relationel database, med sin “deltag”, operationer og lignende, ikke klippe det.

Også: Big data i aktion: ved Hjælp af grafen databaser til at drive ny viden om kunderne

Hvad han og hans kolleger i gang med at bygge på deres egne, hvad der ville blive grundlaget for en virksomhed, var en database, der kan “model alt,” Eifrem insisterer på, med “tre enkle byggesten”: Noder, en repræsentation af et objekt eller enhed; kanter, de linjer, der forbinder knudepunkter til en anden; og “nøgle/værdi par,” – symboler for at gemme og hente ting.

De vidste det ikke dengang, men et lille firma, der hedder Google allerede gør hø med denne tilgang, “PageRank” algoritme, som ville blive grundlaget for verdens største søgemaskine. Eifrem argumenterer for, at den centrale indsigt bag PageRank, hvad der kaldes den “eigenvector centrale placering” er en form for slægtskab mellem Google og alle de andre, der forfølger viden grafer, herunder Neo4j.

“Det faktum, at de bruger tilsluttet data, der er hvad vi gør, kan vi tage den magt, som har skabt næsten en billion dollars i markedsværdi, og vi anvender det til klassiske enterprise tilfælde, ting som afsløring af svig og anbefaling motorer.” Eifrem argumenterer for, den “store Web-virksomheder” som Google var en slags første bølge af knowledge graph bruge, efterfulgt af virksomhedens ansøgning brug med Neo4j, og en tredje bølge, der er lige på vej, ved hjælp af grafen for at hjælpe machine learning og andre kunstig intelligens-metoder.

Også: Graf-database genopfundet: Dgraph sikrer $11.5 M for at forfølge sin unikke og stædig vej

Selv om det er stadig et lille marked, har den enkle, elegante paradigme af en graf, der viser relationer skaber nye fans hver gang det dukker op i en ansøgning. Er der nogle højt profilerede programmer, der allerede er. For eksempel, Daniel Himmelstein, for derefter at arbejde som en ph.d. – studerende ved UC San Francisco, er oprettet en database af genetiske og molekylære vekselvirkninger, der kaldes “Hetionet,” en biologisk oplysninger netværk, som kan bruges til at undersøge forskellige stof-kombinationer. Sin viden om noder og kanter, giver spektakulære grafer af data, som den nedenfor.

project-rephetio-interaction-illustration.png

En illustration af genet og sammensatte interaktioner i biologi fra papiret “Heterogene Netværk Kant Forudsigelse: En Data-Integration Tilgang at Prioritere sygdomsassocierede Gener” af Daniel S. Himmelstein og Sergio E. Baranzini. Hjælp Neo4j, Himmelstein bygget forbindelser system til grafisk spor og repræsenterer interaktioner, der kan have en indflydelse på sygdom og helbredelse.

(Billede: Himmelstein et al.)

Blandt konvertitter er nogle af de mest højprofilerede unge virksomheder, herunder gig økonomi tøj Lyft. I løbet af tre måneder, project manager Mark Grover og et team bestående af fire ingeniører og en designer, var i stand til at samle en første version af et metadata repository, kaldet “Amundsen”, som bruger Neo4j.

Hvis du er interesseret i at læse op på projektet, Grover og holdet har sat op et blog-indlæg; koden er lagt på Github.

Det betyder ikke nødvendigvis give licens salget i hvert enkelt tilfælde, men det bidrager til at vinde hjerter og sind. Forståelse og vedtagelsen af den graf, der er ved at opstå på flere punkter. Google ‘ s DeepMind, for eksempel, er at udforske måder, hvorpå den graf, der kan tjene som et middel til at indsætte “struktureret repræsentationer” i dyb læring neurale netværk. Det kan gøre mere avanceret AI ‘ s evne til at konstruere slutninger ud fra et sæt af “byggeklodser.”

Til Neo4j folkens, dette er den stadige progression af den ubønhørlige logik i grafen.

“Jeg tror, det er en ændring af tankegang,” at flytte til en graf databaser, siger analytics veep Hodler. “Du opleve dette, så du begynder at se på graferne.” Hun hævder at have “en lettere tid på at forklare grafer for ikke-teknikere”, end det ville en ingeniør, der forklarer, sige, at “den tredje-normal form” af en RDBMS til den gennemsnitlige person.

CEO Eifrem er endnu mere eftertrykkelig i at sammenligne grafen til noget, der lyder som skæbne.

“AltaVista så i sort og hvid, og Google så i farve,” siger han i søgemaskinen kampe skinner. Ligeledes “der er en masse ting, der er forbundet i min verden, at jeg ikke var i stand til at fungere på, fordi mine værktøjer var at holde mig tilbage; nu vil jeg bare sætte dem i Neo4j, og jeg kan gøre alt det gode ting.”

“Det er bare et spørgsmål om tid,” siger han.

Big Data

Nej, dette AI ikke har styr ottende klasse videnskab

Fra lav-kode og cloud, at AI og kryptering: Hvad du gør med data, der skal være om mere end buzzwords

Spørgsmålet om AI for ServiceNow er et spørgsmål om, hvad der virker

Hvordan MIT forsøger at løse AI bias (ZDNet YouTube)

Facebook har en ny fred værktøj til at beskytte dine data (CNET)

5 måder Direktører kan bygge en robust, data-driven organization (TechRepublic)

Relaterede Emner:

Data Management

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software