Hur Neo4j tar grafdatabaser i det ordinarie

0
251
neo4j-emil-eifrem.jpg

Neo4j VD EMil Eifrem: “Nu är vi fortfarande ledande inom [grafen databas] rum med objektiva mått.”

Bild: Neo4j

Neo4j har gjort mycket för att popularisera grafdatabas, mest känt genom att hjälpa att analysera Panama Papper.

Med företaget på att bara ha tagit upp $36 mkr för att finansiera ytterligare expansion, ZDNet nyligen talade till bolagets VD Emil Eifrem om nästa steg.

ZDNet: $36 miljoner är mycket pengar, hur tänker du för att spendit?

Eifrem: Ja, det är en hel del pengar. Det är en privat investering och vi har varit försiktiga och eftertänksamma om att distribuera dessa pengar. Vi har varit mycket Europeisk, om du kommer, om hur vi driver vårt företag jämfört med alla andra databaser för företag, några av dem att höja $150 miljoner till $300 miljoner. Vi har alltid som mål att växa i lite mer försiktig och cash-effektiv sätt.

Du har inte varit ett företag som kastar pengar omkring sig.

Det är det som är så tokig i Silicon Valley. I andra världen, om du hade höjt $35 till $50m och nu en extra $36, vilket är vad vi har gjort hittills, det skulle vara en massa pengar. Det är en hel del pengar i resten av världen, men [i Silicon Valley] det är det inte.

Vi tror att få faktiska validering genom betalande kunder är ett mycket hälsosammare sätt att göra saker.

När du spenderar pengar, kommer du att fokusera på att expandera eller på R&D?

Vi kommer att investera över hela linjen. Vi investerar i produktutveckling, konstruktion, försäljning och marknadsföring, men den stora berättelsen om det här med pengar är en investering i produkten.

Vi tror att i slutändan företag bör bygga bra produkt som folk vill ha. Det är vad vi vill göra. Ja, vi kommer att spendera på marknadsföring för att få ordet ut i Amerika är en viktig del av detta, och i slutändan vi bör dra nytta av det.

Nu är vi på en mycket intressant punkt i diagrammet utrymme. Vi vet inte exakt egna som rymden, men vi är det enda företaget att dra nytta av grafen på ett bra sätt.

För år och år, vi var solo röst i kören. Nu, andra är med i den kören. Nu några av de stora aktörerna är att tillkännage produkter i diagrammet utrymme. Oracle har nu en grafdatabas som gör Amazon, Microsoft och SAP. Uppenbarligen är vi fortfarande ledande inom det utrymmet av något objektivt mått, DB-Engine, den externa data poäng. Vi är stora på denna plats som alla andra tillsammans.

Vi är ledande i dag, men vi kan inte ta något för givet. Om du tittar på Microsoft, de har en enorm mängd pengar att kasta på saker, så tycker vi att nu är verkligen rätt tid att starta fler investeringar i produkten för att säkerställa att vi verkligen kvar som ledare.

Säkert en fördel för dig måste vara att du har en del av immateriell egendom på den här marknaden?

Vi har en hel del unika och egenutvecklade immateriella egendom, och om det visar sig att trots att vi håller på att bygga en databas, och det har varit många databaser som är byggda före, det faktum att vi har en databas som är centrerad kring relationer, som är centrerad kring kopplingar mellan datapunkter, och inte bara de uppgifter som pekar sig själva, som faktiskt gör en massa saker, jag skulle inte säga upp och ner, men jag skulle säga att det gör dem 90 grader.

Det finns ett antal saker som är liknande för att bygga en vanlig databas, men det finns ett antal saker som är annorlunda, speciellt om du håller på att bygga vad som kallas en “native grafdatabas”. Det är verkligen där guld — bygga en databas som är helt optimerad runt diagram och [visar] – anslutningar med hjälp av data från grunden.

Nu när du gör det, du har för att bryta en hel del ny mark.

Hur gör du om det?

Det handlar om att ta det grundläggande perspektivet i din skorsten eller ditt moln. Jag är säker på att hela din karriär som du har sett som en miljard diagram som visar en tre-tier arkitektur-i en databas och sedan ett mellanskikt och sedan ett övre lager. Vi har sett det så många gånger.

Skillnaden är att vi dubbel stack på en databas med flera lager, så att du har dessa nivåer inne i en databas. Vad du gör i en grafdatabas är att du titta på var och en av dem, och de har alla nördiga namn som transaktionen delsystem, eller en cache-lager, och så vidare, och det är mycket hard-core nördiga grejer.

Men i grund och botten, du ser på var och en av dem och du tänker, ” Om jag bara kunde lägga våra data i tabellform som denna och kunde verkligen butik varje bit, hur skulle jag utvärdera varje bit när jag lägger ut det så här?’.

Jag London vi har en stor fou-centrum, och det är faktiskt en av de viktigaste saker som lockar människor, som lockar världsklass ingenjörer att arbeta med oss, och det faktum att vi gör helt nya saker. Det är inte bara en webb-app baserad på någon ny, modern teknik. Vi gör helt nya och nya saker.

Kan du ta mig genom den nya, 3.1 enterprise-versionen?

Vi ser saker som obegränsad storlek lagring motorer, och nu 3.1 handlar om företagets styrka. Nu är en fras som alla kastar omkring, men vad vi har sett hända under de senaste sex till nio månader är en förskjutning i hur grafdatabaser antas. Det brukade vara, och det är fortfarande till stor del i dag att du väljer en grafdatabas för en specifik lösning. Du kan vara med och bygga upp en databas eller en rekommendation motor, eller en identitet management-lösning och du har en hel del kontakter i dina uppgifter, så du ser på ett diagram databas.

Det händer fortfarande, men på senare tid har vi sett en förskjutning där företag har börjat anta Neo4j som ett enterprise-wide-standarden. Nu är det en ganska viktig sak, eller hur?

Vi har nu 75 till 100 global 2000 kunder. Vi har 200 kunder totalt, så tydligt vi kan skala. Fyra top 10-återförsäljare i världen använder Neo4j i dag. Nu är vi fortfarande ett ganska litet företag, så jag tror att det är ganska coolt.

Nu är den typen av framwork där vi ser 3.1 release. Vi ser att det finns ett antal punkter där om vi lägger till dessa funktioner till databasen, det kommer att påskynda enterprise cloud antagande.

I denna nya version, de två viktigaste punkter är vår nästa generation klustring arkitektur och våra nya säkerhets-stiftelsen.

Klustring arkitektur är en stor bit av teknik som vi har arbetat på i över två år. Det hade byggts ut i London och vår chief scientist är baserade här.

Det är i grunden re-arkitekter hur vi spara våra grafdatabaser. Det finns ett antal underliggande funktioner, men den viktigaste funktionen du får ut av det är vad som kallas “kausala konsekvens”. Det är ett nördigt namn på den funktion som är kausala klustring. Vad det betyder är att om du skriver ett värde — låt säger du gå till ditt bankkonto och du uppdatera den till, låt oss säga, en miljon dollar, sedan med andra kluster arkitekturer de göra vad som kallas, “så småningom konsekvent”. Så skriver de en miljon dollar till den nod, då du läsa tillbaka från nod och du först få det gamla värdet och det kommer så småningom att uppdateras till det nya värdet.

Nu arkitektur har fördelar i form av skalbarhet, men vi tycker bara att det är ett hemskt sätt att skriva på ett företagsprogram.

Nu har vi skrivit det så att om du skriver en miljon till ett konto, är det garanterat att inom en millisekund du kommer att få miljoner. Vi har gjort det på ett sådant sätt som kombinerar konsekvens med skalbarhet.

Den andra viktiga funktionen är säkerhet. Detta är en av de saker som om du bara sälja till Silicon Valley som kunder, öppen källkod personer, hackare, och så vidare, som de egentligen inte bryr sig om detta, men om du säljer till banker, myndigheter, stora företag då, vid den tidpunkten, säkerhet blir en viktig sak.

Vi har gjort en hel del arbete på saker som gör att vi, till exempel, att göra saker som att bara tillåta vissa personer att läsa från en databas eller från vissa delar av databasen, och vi kan göra detta finkornig.

Sedan är det alla de saker som gör det möjligt för dig att vara kompatibel med alla relevanta säkerhets-mandat.

Den mest relevanta sak som vi har gjort är att ha alla de här sakerna som gör att du kompatibel men samtidigt som du använde för att behöva gå igenom en hel del att ställa upp och manuellt arbete, vi har lagt allt i ramar.

Vi hoppas att detta kommer att påskynda enterprise-wide-distributioner.

Finns det speciella områden, oavsett om det är bank -, finans-eller läkemedel, där du finner intresse?

Ja, under de senaste två åren vad vi har funnit att när du definierar nya kategorier, som du inte riktigt vet vart den är på väg att antas först. Men vi har fördelen av att vara öppen källkod så att du bara sortera av att släppa ut den.

Men nu när vi har nått riktigt skala, kan vi titta på dessa och börja se mönster. Ett par av mönster som vi har sett är att människor älskar att använda grafen databaser i realtid rekommendationer. Kunden gillade detta, han har likheter med kunden B så kanske vi ska erbjuda detta till kund B. Det är en mycket populär att använda.

En annan om att upptäcka bedrägerier. Med hjälp av diagrammet i databaser, kan du lätt hitta mönster i data-det är väldigt mycket vad vi gör — och upptäckt av bedrägeri är en hel del om att hitta mönster. De lätt kan användas inte bara för att upptäcka bedrägeri, men för förebyggande också.

Det betyder att när jag dra ett kreditkort, kan jag få en omedelbar ” ja “eller” nej ” i stället för timmar senare.