Hoe Neo4j is het nemen van graph databases in de mainstream

0
270
neo4j-emil-eifrem.jpg

Neo4j CEO EMil Eifrem: “Nu zijn we duidelijk nog steeds de leider in [de grafiek database] uit de ruimte door een objectieve maatstaf.”

Afbeelding: Neo4j

Neo4j heeft veel gedaan aan de popularisering van de grafiek database, het meest beroemde, door te helpen bij het analyseren van de Panama Papieren.

Met het bedrijf hebben net verhoogd $36m te financieren verdere uitbreiding, ZDNet sprak onlangs tot CEO van een bedrijf Emil Eifrem over de volgende stappen.

ZDNet: $36m is een hoop geld, hoe bent u van plan om spendit?

Eifrem: Ja, het is een hoop geld. Het is een privé-investering en we zijn voorzichtig en bedachtzaam over het implementeren van dit geld. We zijn heel Europees, als je wil, over de manier waarop wij ons bedrijf in vergelijking met alle andere database-bedrijven, een aantal van hen het verhogen van $150 miljoen en $300 miljoen. We hebben er altijd naar gestreefd om te groeien in een beetje meer voorzichtig en cash-efficiënte manier.

U beschikt niet over een bedrijf dat gooit geld in de buurt?

Dat is wat zo gek Silicon Valley. In een andere wereld, als je had verhoogd $35m tot $50 miljoen en nu een extra $36, dat is wat we gedaan hebben, tot op heden, het zou een hoop geld. Het is een hoop geld in de rest van de wereld, maar [in Silicon Valley] is het niet.

We denken aan de daadwerkelijke validatie door middel van het betalen van klanten is een veel gezondere manier van doen.

Wanneer u geld uitgeeft, je gaat richten op het uitbreiden of op R&D?

We gaan investeren in de raad van bestuur. We investeren in het product, in de techniek, in sales en marketing, maar het grote verhaal van dit geld wordt geïnvesteerd in het product.

Wij denken dat het uiteindelijk moeten de bedrijven het bouwen van geweldige product die de mensen willen. Dat is wat we willen doen. Ja, we zullen besteden aan marketing, want om het woord uit in Amerika is een belangrijk onderdeel van dat, en uiteindelijk moeten we van profiteren.

We zijn nu op een zeer interessant punt in de grafiek ruimte. We niet precies die ruimte, maar wij zijn het enige bedrijf te kunnen profiteren van een grafiek in een grote weg.

Voor jaren en jaren, we waren de solo stem in dat koor. Nu, anderen zijn toetreding tot het koor. Nu een aantal van de belangrijke spelers is de aankondiging van producten in de grafiek ruimte. Oracle heeft nu een grafiek database, net als Amazon, Microsoft en SAP. We zijn duidelijk nog steeds de leider in die ruimte door een objectieve maat, de DB-Engine, de externe gegevens. Wij zijn groot in deze ruimte als iedereen anders gecombineerd.

Wij zijn de leider van vandaag, maar we kunnen niet alles voor lief. Als je kijkt naar Microsoft, ze hebben een enorme hoeveelheid geld om te gooien naar spul, dus we denken dat het nu wel het juiste moment om te beginnen met meer investering in het product om te verzekeren dat we echt blijven van de leider.

Zeker een voordeel voor u moet zijn dat je veel van intellectuele eigendom op deze markt?

We hebben veel van de unieke en gepatenteerde intellectuele eigendom, en als het blijkt dat, hoewel we bouwen aan een database, en er zijn veel databases gebouwd voor het feit dat wij een database die is gecentreerd rond relaties, dat is gecentreerd rond de verbindingen tussen de meetpunten, en niet alleen de gegevens die punten zelf, eigenlijk verandert een heleboel dingen, ik zou niet zeggen ondersteboven, maar ik zou zeggen zet ze 90 graden.

Er zijn een aantal dingen die vergelijkbaar zijn met het bouwen van een reguliere database, maar er zijn een aantal dingen die anders zijn, vooral als u het bouwen van wat heet een “native grafiek database”. Dat is echt waar het goud is — het bouwen van een database die volledig is geoptimaliseerd rond grafiek en [toont] verbindingen door middel van gegevens uit de grond omhoog.

Nu als je dat doet, heb je te breken veel van de nieuwe grond.

Hoe pak je dat aan?

Het gaat over het nemen van die fundamentele perspectief op de stapel of uw cloud. Ik ben er zeker van dat in uw carrière die u hebt gezien, zoals een miljard diagrammen die een drie-tier architectuur — een database en vervolgens een midden-laag en een toplaag. We hebben gezien dat zo vaak.

Het verschil is dat we double stack op een database met meerdere lagen, dus je hebt deze lagen in een database. Wat je uiteindelijk te doen in een grafiek database is dat je kijkt naar elke en elke één van hen, en ze hebben allemaal geeky namen, zoals transactie-subsysteem of een caching laag, en dus op, en het is allemaal heel hard-core geeky stuff.

Maar fundamenteel, je kijkt naar elke en elke één van hen en je denkt, ” Als ik kon gewoon liggen onze gegevens in tabelvorm als deze en kan echt elke winkel en elk stuk, hoe zou ik het evalueren van elk stuk toen ik leg het uit als dit?’.

Ik Londen hebben we een grote R&D-centrum, en dat is eigenlijk een van de belangrijkste dingen die mensen aantrekt, dat trekt de wereld-klasse engineers om te werken met ons, dat en het feit dat we aan het doen zijn volledig nieuwe dingen. Het is niet alleen een web-app op basis van een aantal nieuwe, modieuze technologie. We doen het volledig nieuwe en van nieuwe dingen.

Kun je me via de nieuwe, 3.1 enterprise-versie?

We zien dingen zoals onbeperkte grootte van de opslag van de motoren, en nu 3.1 is alle informatie over enterprise kracht. Nu dat is een zin die iedereen gooit rond, maar wat we hebben zien gebeuren in de laatste zes tot negen maanden is een verschuiving in de manier waarop graph databases worden aangenomen. Het gebruikt te worden, en het is nog steeds grotendeels vandaag dat u een grafisch gegevensbestand voor een specifieke oplossing. U kunt bouwen aan een product database of een aanbeveling van de motor, of een identity management oplossing en je hebt een veel verbindingen in uw gegevens, zodat u kijken naar een grafiek database.

Gebeurt dat nog maar onlangs wat we gezien hebben is een verschuiving waar bedrijven begonnen zich te nemen Neo4j als een enterprise-brede standaard. Nu is dat best een belangrijk ding, toch?

We hebben nu 75 tot 100 global 2000 klanten. We hebben 200 klanten in totaal zo duidelijk kunnen wij schaal. Vier van de top 10 retailers in de wereld gebruik Neo4j vandaag. Nu zijn we nog steeds een vrij klein bedrijf, dus ik denk dat dat behoorlijk cool.

Nu dat is het soort van het kader waarin we zien de 3.1 versie. We zien dat er een aantal punten die, als we u deze functies kunt toevoegen aan de database, zal versnellen enterprise cloud-adoptie.

In deze nieuwe versie zijn de twee belangrijkste punten zijn onze volgende generatie clustering architectuur en onze nieuwe security foundation.

De clustering architectuur is een enorm stuk techniek dat we hebben gewerkt voor meer dan twee jaar. Het was gebouwd in Londen en onze chief scientist is hier gevestigd.

Het principe is dat het re-architecten de manier waarop wij onze graph databases. Er zijn een aantal onderliggende functies, maar de belangrijkste eigenschap die je krijgt is wat wordt genoemd “causale consistentie”. Het is een maffe naam voor de functie die causale clustering. Wat dat betekent is dat als u een waarde invult — let ‘ s zegt, gaat u naar uw bankrekening en u een update van het, laten we zeggen, een miljoen dollar, dan met andere clustering architecturen ze doen wat heet, “uiteindelijk consistent’. Dus schrijven ze een miljoen dollar aan de node, dan lees je weer uit de knoop, en je voor het eerst de oude waarde en dat zal uiteindelijk worden bijgewerkt met de nieuwe waarde.

Nu dat architectuur heeft voordelen in termen van schaalbaarheid, maar we denken dat het een verschrikkelijke manier van schrijven in een enterprise-applicatie.

Nu hebben we geschreven, dat het zo dat als je een miljoen om een account aan, het is gegarandeerd dat binnen een milliseconde je krijgt dat miljoen. We hebben dat gedaan op een manier die combineert de consistentie met de schaalbaarheid.

De tweede belangrijkste eigenschap is de veiligheid. Dit is een van die dingen dat als je alleen verkopen aan Silicon Valley, de klanten, de open source individuen, hackers, en ze niet echt zorgen over, maar als je verkopen aan banken, overheid, grote bedrijven dan, op dat moment, veiligheid een centrale ding.

We hebben veel werk gedaan op de dingen die ons in staat stellen, bijvoorbeeld om dingen te doen zoals dat alleen bepaalde mensen te lezen uit een database of van bepaalde delen van de database, en wij kunnen dit fijnmazig.

Dan is er al de dingen die u in staat stelt om compatibel te zijn met alle relevante veiligheids-mandaten.

De meest relevante ding dat we hebben gedaan is zijn alle deze dingen, dat maakt je compliant zijn, maar terwijl u gebruikt om in te gaan door een hoop instellen en handmatig werk, we hebben alles in kaders.

We hopen dat dit zal versnellen van de implementaties.

Zijn er bepaalde gebieden, of het bank -, financie -, of pharmaceuticals, waar u het vinden van belang?

Ja, de afgelopen twee jaar, wat we hebben ontdekt dat bij het definiëren van nieuwe categorieën, u echt niet weet waar het zal worden goedgekeurd. Maar we hebben het voordeel van open source, zodat je een soort van laat het uit.

Maar nu hebben we bereikt ware schaal, kunnen we kijken naar deze en start het zien van patronen. Een aantal van de patronen die wij hebben gezien dat de mensen graag gebruik maken van graph databases voor real-time aanbevelingen. Klant vond dit, hij heeft overeenkomsten met de klant op B, dus misschien moeten we dit aanbieden aan klant B. Dat is een zeer populaire gebruik.

Andere als de opsporing van fraude. Het gebruik van graph databases, kunt u heel gemakkelijk vinden van patronen in data — dat is heel veel wat we doen-en het opsporen van fraude is een veel over het vinden van patronen. Ze kunnen gemakkelijk worden gebruikt, niet alleen voor het opsporen van fraude, maar voor preventie.

Dat betekent dat wanneer ik veeg een creditcard, kan ik er onmiddellijk een ‘ja’ of ‘nee’ in plaats van een uur later.