Hvordan Neo4j tager graf databaser i mainstream

0
357
neo4j-emil-eifrem.jpg

Neo4j administrerende DIREKTØR EMil Eifrem: “Nu er vi stadig førende i [graph database] plads ved enhver objektiv målestok.”

Billede: Neo4j

Neo4j har gjort meget for at udbrede graf-database, der er mest berømt ved at hjælpe med at analysere Panama-Papirer.

Med det selskab, der har lige rejst $36m til at finansiere yderligere ekspansion, ZDNet, der for nylig talte til selskabets administrerende DIREKTØR Emil Eifrem om de næste skridt.

ZDNet: $36m er en masse penge, hvordan har du tænkt dig at spendit?

Eifrem: Ja, det er en masse penge. Det er et privat investering, og vi har været forsigtige og tankevækkende om implementering af disse penge. Vi har været meget Europæisk, hvis du vil, om hvordan vi driver vores virksomhed i forhold til alle de andre database virksomheder, nogle af dem hæve $150 millioner til $300 millioner. Vi har altid til formål at dyrke det i en lidt mere forsigtig og kontant-effektiv måde.

Du har ikke været i en virksomhed, der kaster penge rundt?

Det er, hvad er så vild med Silicon Valley. I en anden verden, hvis du havde rejst $35 m til $50 m, og nu er en ekstra $36, hvilket er, hvad vi har gjort til dato, ville det være en masse penge. Det er en masse penge i resten af verden, men [i Silicon Valley] det er det ikke.

Vi tror, at få faktiske validering gennem betalende kunder er en meget sundere måde at gøre tingene på.

Når du bruger penge, du kommer til at fokusere på at udvide eller på R&D?

Vi kommer til at investere på tværs af bestyrelsen. Vi investerer i produktet, teknik, salg, marketing, men den store fortælling af disse penge er en investering i produktet.

Vi tror, at i sidste ende virksomhederne bør opbygge fantastisk produkt, som folk vil have. Det er, hvad vi ønsker at gøre. Ja, vi vil bruge på markedsføring, fordi at få ordet ud i Amerika er en vigtig del af det, og i sidste ende bør vi drage fordel af det.

Nu er vi på en meget interessant punkt i grafen plads. Vi behøver ikke ligefrem at eje plads, men vi er den eneste virksomhed for at drage fordel af grafen i en stor måde.

For år og år, vi var solo stemme i dette kor. Nu, mens andre slutter sig til koret. Nu er nogle af de store spillere annoncerer produkter i grafen plads. Oracle har nu en graf-database, som gør Amazon, Microsoft og SAP. Vi er helt klart stadig førende i dette rum ved enhver objektiv målestok, DB-Engine, den eksterne data punkter. Vi er så store i dette rum, som alle de andre tilsammen.

Vi er førende i dag, men vi kan ikke tage noget for givet. Hvis man ser på Microsoft, har de en enorm mængde af penge til at smide på ting, så vi tror, at nu er den rette tid til at starte flere investeringer i produktet for at sikre, at vi fortsat leder.

Helt sikkert en fordel for dig må være at du har en masse af intellektuelle ejendomsrettigheder på dette marked?

Vi har en masse unikke og egne intellektuelle ejendom, og hvis det viser sig, at selv om vi er ved at opbygge en database, og der har været mange databaser, der er bygget før, det faktum, at vi har en database, der er centreret omkring forhold, der er centreret omkring forbindelser mellem datapunkterne, og ikke blot data punkter sig selv, faktisk viser en masse ting, jeg ikke ville sige på hovedet, men jeg vil sige, det gør dem i 90 grader.

Der er en række ting, der er lignende til at opbygge en regelmæssig database, men der er en række ting, der er anderledes, især hvis du er ved at opbygge, hvad der kaldes en “native graf-database”. Der er virkelig, hvor guldet er-at opbygge en database, der er fuldt optimeret omkring graf og [viser] – forbindelser gennem data fra jorden op.

Nu når du gør det, du er nødt til at bryde en masse nye jord.

Hvordan kan du gå om det?

Det handler om at tage det grundlæggende perspektiv i din stack eller din cloud. Jeg er sikker på, at i løbet af din karriere, at du har set ligesom en milliard diagrammer, der viser en tre-lags-arkitektur — i en database og derefter et midterste lag og derefter en øverste lag. Vi har set det så mange gange.

Forskellen er, at vi dobbelt stack på en database med flere lag, så du har disse lag inde i en database. Hvad du ender med at gøre i en graf-database er, at man ser på hver og en af dem, og de har alle nørdede navne som transaktionen delsystem, eller en caching lag, og så videre, og det er alle meget hard-core nørdede ting.

Men grundlæggende, at man ser på hver og en af dem, og du tænker, ‘Hvis jeg bare kunne lægge vores tabulære data, som dette, og kunne virkelig gemme hvert eneste stykke, hvor ville jeg vurdere hvert enkelt stykke, når jeg lægger det ud som denne?”.

I London har vi en stor R&D-center, og der er faktisk en af de vigtigste ting, der tiltrækker folk, der tiltrækker verdens klasse ingeniører til at arbejde med os, og det faktum, at vi laver helt nye ting. Det er ikke bare en web-app, baseret på nogle nye, moderne teknologi. Vi laver helt nye ting.

Kan du tage mig gennem den nye, 3.1 enterprise version?

Vi er at se ting som ubegrænset størrelse opbevaring motorer, og nu 3.1 handler om virksomhedens styrke. Nu, der er en sætning, som alle kaster rundt, men hvad vi har set ske i løbet af de sidste seks til ni måneder, er et skift i hvordan grafen databaser er vedtaget. Det plejede at være, og det er det stadig i vid udstrækning i dag, at du vælger en graf-database til en bestemt løsning. Du kan bygge et produkt database eller en henstilling engine, eller en identity management-løsning, og du har en masse forbindelser i dine data, så du ser på en graf-database.

Der sker stadig, men for nylig, hvad vi har set, er et skift, hvor virksomhederne er begyndt at vedtage Neo4j som en enterprise-wide standard. Nu det er en ret væsentlig ting, højre?

Vi har nu 75 til 100 global 2000 kunder. Vi har 200 kunder i alt, så det er klart at vi kan skalere. Fire af de top 10 forhandlere i verden bruger Neo4j i dag. Nu vi er stadig en ret lille virksomhed, så jeg tror, det er temmelig cool.

Nu, der er lidt af strukturen, hvor vi ser 3.1 udgivelse. Vi kan se, at der er en række punkter, hvor der, hvis vi tilføje disse funktioner til databasen, det vil accelerere virksomhedens cloud adoption.

I denne nye version, to af de vigtigste punkter er vores næste generation af klyngedannelse arkitektur og vores nye security foundation.

Klyngedannelse arkitektur er et stort stykke ingeniørarbejde, som vi har arbejdet på i over to år. Det var blevet bygget ud af London og vores chief scientist er baseret her.

Det dybest set re-arkitekter den måde sparer vi vores graf databaser. Der er en række underliggende funktioner, men det vigtigste element, du får ud af det er, hvad der kaldes en “kausal sammenhæng”. Det er en nørdet navn for den funktion, som er kausale klyngedannelse. Hvad det betyder er, at hvis du skriver en værdi — lad os siger du gå til din bank konto, og du opdatere det til, siger en million dollars, så med andre klynger arkitekturer de gør, hvad de hedder, “i sidste ende konsekvent”. Så skriver de en million dollars til den node, så kan du læse tilbage fra node, og du først få den gamle værdi, og det vil i sidste ende få opdateret til den nye værdi.

Nu, at arkitektur har upsides i form af skalerbarhed, men vi synes bare, at det er en forfærdelig måde at skrive på en virksomheds anvendelse.

Nu har vi skrevet det så, at hvis du skriver en million til en konto, det er garanteret, at der inden for et millisekund, vil du få at millioner. Vi har gjort det på en sådan måde, at der kombinerer sammenhæng med skalerbarhed.

Den anden vigtige funktion er sikkerhed. Dette er en af de ting, som hvis du kun sælger til Silicon Valley kunder, open source enkeltpersoner, hackere, og så videre, de ikke virkelig bekymrer sig om dette, men hvis du sælger til banker, offentlige, store virksomheder så, på det tidspunkt, sikkerhed bliver en central ting.

Vi har gjort en masse arbejde på ting, der gør det muligt for os, for eksempel, til at gøre ting, som kun tillade, at visse folk til at læse fra en database eller fra bestemte dele af databasen, og at vi kan gøre dette finkornet.

Så er der alle de ting, der gør det muligt for dig at være i overensstemmelse med alle relevante sikkerheds-mandater.

De mest relevante ting, som vi har gjort, er at have alle disse ting, der gør du-kompatibel, men mens du plejede at have til at gå igennem en masse for at oprette og manuelt arbejde, vi har sat det hele ind i rammer.

Vi håber, at dette vil fremskynde enterprise-wide-installationer.

Er der særlige områder, uanset om det er bank -, finans -, eller lægemidler, hvor du er at finde interesse?

Ja, i løbet af de sidste to år, hvad vi har fundet, at når du definerer nye kategorier, du ikke rigtig ved, hvor det kommer til at blive vedtaget første. Men vi har den fordel af at være open source, så du bare lader det ud.

Men nu, at vi har nået sande omfang, vi kan se på disse, og begynde at se mønstre. Et par af de mønstre, vi har set, er, at folk elsker at bruge graf databaser for real-time anbefalinger. Kunde godt lide det, han har ligheder med kunden B, så måske skulle vi tilbyde dette til kunden B., Der er en meget populær brug.

En anden, hvis afsløring af bedrageri. Ved hjælp af grafen databaser, kan du meget nemt finde mønstre i data-der er meget, hvad vi gør-og afsløring af svig er en masse om at finde mønstre. De kan nemt bruges ikke kun for at opdage besvigelser, men for forebyggelse.

Det betyder, at når jeg knalde et kreditkort, kan jeg få en umiddelbar ” ja “eller” nej ” i stedet for timer senere.