In de liefde met de grafiek: Neo4j verspreidt de obsessie van een nieuwe database een app op een moment

0
138

Hoe maak analytics meer toegankelijk voor het algemene zakelijke gebruiker
Kate Wright, hoofd van augmented business intelligence-Hana een Analytics op SAP, legt Tonya Hal van het proces en het belang van het maken van analyses beschikbaar voor meer dan alleen gegevens wetenschappers.

De meeste enterprise software heeft een contingent van de zeloten, mensen die zo doordrenkt van de technologie die ze zijn ervan overtuigd dat het is en het einde van alle, of degenen die hebben genomen zo veel examens dat is alles wat ze weten. De liefhebbers van de kennis grafiek lijkt een beetje dieper soort van overreding.

“Ik stuitte op het idee van het kijken naar complete netwerken van relaties, in tegenstelling tot individuele elementen, en ik viel in liefde met het idee,” zegt Amy Hodler, die de analyses en AI programma manager voor Neo4j, een 12 jaar oude San Francisco opstarten verkoopt een database programma met dezelfde naam, waarin de objecten worden verantwoord, worden weergegeven als “knooppunten” in een netwerk grafiek, samen met “randen” die hun kennis.

Hodler is niet alleen een fan van haar bedrijf, werk, ze is een kenner van alle grafische dingen, zoals het schrijven van grafiek geleerde Albert-László Barabasi — “ik heb al zijn boeken” — en meer populaire namen, zoals James Fowler, die schreef De New York Times bestseller Aangesloten (“dat is een geweldig boek.”)

hetionet-exploration-sept-13-2019.png

Een voorbeeld knowledge graph verkenning van Hetionet, een toepassing die het gebruik van Neo4j door UC San Francisco graduate student Daniel Himmelstein.

(Afbeelding: Himmelstein et al.)

Liefde is de grafiek is, beweert ze, om iets te zien, andere niet. “Je zou het alles weten over een kraai vliegen, maar u zou het niet weten een kudde,” zegt Hodler.

Er is een punt om deze passie in een wereld die nog steeds wordt geëvangeliseerd. Grafiek databases nog niet overgenomen. De relationele database nog sterk de boventoon. En er zijn allerlei andere gegevens opgeslagen in toenemende mate voor diverse vormen van ongestructureerde gegevens, met inbegrip van Hadoop en de “No SQL” menigte.

neo4j-amy-hodler-2019.jpg

Amy Hodler, die de analyses en AI programma manager voor Neo4j, struikelde op de grafentheorie en de grafiek van databases tijdens het beoefenen van google analytics. Ze gelooft dat het mogelijk maakt om te kijken op verschillende manieren.

(Afbeelding: Neo4j)

Maar de menigte, die gebouwd Neo4j lijkt te hebben gevorderd door enthousiasme, vanaf het inzicht en misschien een beetje van naïveté.

“We waren jong en dom genoeg om te zeggen dat het bouwen van een database, hoe moeilijk kan het zijn,” zegt Emil Eifrem, oprichter en CEO van Neo4j. Hij en collega ‘ s stuitte op het idee toen was hij werkzaam als CTO, vers van de hogeschool, voor een zweedse tech startup, Windh Technologieën. Iets was gewoon niet te klikken met het gebruik van de relationele database voor een content management systeem.

“Ik had programmering voor de helft van mijn leven op dat moment,” reflecteert hij, “en in elk project, de database al een hulp, een gaspedaal, iets dat zorgde dingen voor mij, maar voor sommige reden, het was het vertragen van ons naar beneden die tijd rond.”

Het werd duidelijk, zegt hij, dat er een “mismatch” tussen de gegevens en de relationele gegevens structuur van Oracle en Informix. Een enterprise content management systeem, legt Eifrem, is als een grote bestandssysteem op het World Wide Web, met mappen binnen mappen en symbolische koppelingen tussen hen, “veel van de aangesloten gegevens”, zoals hij het uitdrukt. De rij-en kolom structuur van een relationele database, met de “join” – operaties en dergelijke, niet knippen.

Ook: Big data in actie: het Gebruik van graph databases naar nieuwe customer insights

Wat hij en collega ‘ s begon te bouwen op hun eigen, wat zou uitgroeien tot de basis van een bedrijf van een database die kan “model alles,” Eifrem benadrukt met “drie simpele bouwstenen”: Knooppunten, een representatie van een object of entiteit; randen, de lijnen die knooppunten met elkaar verbinden om een ander; en “sleutel/waarde-paren,” symbolen die het opslaan en ophalen van dingen.

Ze wist niet dat het dan maar een klein bedrijf genaamd Google was al het maken van hooi met deze aanpak, de “PageRank” algoritme dat zou de basis geworden van de ‘ s werelds grootste zoekmachine. Eifrem betoogt dat de centrale inzicht achter PageRank, wat ook wel het “eigenvector centraliteit,” is een soort van verwantschap tussen Google en alle anderen nastreven van kennis grafieken, met inbegrip van Neo4j.

“Het feit dat zij verbonden gegevens, dat is wat we doen, nemen we die kracht die bijna een biljoen dollar in de markt cap, en passen we dat aan klassieke enterprise gevallen, dingen zoals het opsporen van fraude en het advies van de motoren.” Eifrem betoogt de “grote internet bedrijven zoals Google waren een soort van eerste golf van de knowledge graph gebruiken, gevolgd door een enterprise applicatie te gebruiken met Neo4j, en een derde golf die is net in opkomst, met behulp van de grafiek te helpen machine learning en andere kunstmatige intelligentie benaderingen.

Ook: Grafiek database opnieuw uitgevonden: Dgraph haalt $11,5 M aan om haar unieke en eigenzinnige pad

Hoewel het nog steeds een kleine markt, de eenvoudige, elegante paradigma van een grafiek die aangeeft relaties creëert nieuwe fans elke keer te zien in een toepassing. Er zijn een aantal high-profile reeds toepassingen. Bijvoorbeeld, Daniel Himmelstein, dan werken als een afgestudeerde student aan de UC San Francisco, een database gemaakt van de genetische en moleculaire interacties, genaamd “Hetionet,” een biologische informatie netwerk dat kan worden gebruikt voor het bestuderen van mogelijke drug combinaties. Haar kennis van knopen en kanten produceert spectaculaire grafieken van gegevens zoals deze hieronder.

project-rephetio-interaction-illustration.png

Een illustratie van gen en samengestelde interacties in de biologie van het papier “Heterogeen Netwerk Rand Voorspelling: Een Data-Integratie Aanpak en de Prioriteit van de Ziekte-Geassocieerde Genen” door Daniel S. Himmelstein en Sergio E. Baranzini. Met behulp van Neo4j, Himmelstein bouwde de verbindingen systeem-grafisch trace en vertegenwoordigen interacties die kunnen een invloed hebben op ziekte en genezing.

(Afbeelding: Himmelstein et al.)

Onder de bekeerlingen zijn een aantal van de meest high-profile jonge bedrijven, waaronder het optreden economie outfit Lyft. Over drie maanden, project manager Mark Grover en een team van vier ingenieurs en ontwerpers in staat waren samen te brengen in een eerste versie van een metadata repository, genaamd “Amundsen” met behulp van Neo4j.

Als u geïnteresseerd bent in het lezen over het project, Grover en het team hebben een blog-post; de code is te vinden op Github.

Dat hoeft niet per se produceren licentie voor de verkoop in ieder geval, maar het draagt bij aan het winnen van de harten en geesten. Inzicht in en acceptatie van de grafiek aan het ontstaan is op meerdere punten. Google DeepMind, bijvoorbeeld, is het verkennen van manieren waarop de grafiek kan dienen als een middel van het plaatsen van “gestructureerde representaties in de diepe leren, neurale netwerken. Dat kan meer geavanceerde AI de mogelijkheid om te bouwen van de conclusies van een set van “bouwstenen.”

De Neo4j mensen, dit is al de gestage vooruitgang van de meedogenloze logica van de grafiek.

“Ik denk dat het een verandering van denken,” met de verhuizing naar graph databases, zegt analytics veep Hodler. “Je ervaart dit als je begint te kijken naar grafieken.” Ze beweert te hebben “makkelijker uit te leggen grafieken voor niet-technologen” dan zou een ingenieur uit te leggen, zeggen, “de derde normaal vorm” van een RDBMS voor de gemiddelde persoon.

CEO Eifrem is nog meer uitgesproken in vergelijking met de grafiek naar iets dat klinkt als bestemming.

“AltaVista zag in zwart en wit, en Google zag in kleur,” zegt hij van de zoekmachine veldslagen van weleer. Ook, “er zijn een heleboel dingen die in mijn leven dat ik niet in staat was om te werken op omdat mijn tools hielden me terug; nu ik leg ze in Neo4j, en kan ik al die goede dingen.”

“Het is gewoon een kwestie van tijd,” zegt hij.

Big Data

Nee, dit AI nog niet onder de knie achtste leerjaar wetenschap

Van lage-code en de cloud, naar AI, en de versleuteling: Wat je doet met de gegevens moet worden over meer dan modewoorden

De vraag van AI voor ServiceNow is een kwestie van wat werkt

Hoe MIT probeert op te lossen AI bias (ZDNet YouTube)

Facebook heeft een nieuwe privacy tool om uw gegevens te beschermen (CNET)

5 manieren Ceo ‘ s kan het bouwen van een veerkrachtige, data-gedreven organisatie (TechRepublic)

Verwante Onderwerpen:

Data Management

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software