I kärlek med grafen: Neo4j sprider besatthet av en ny databas som en app på en gång

0
182

Hur man gör analytics mer tillgänglig för den allmänna verksamheten användare
Kate Wright, chef för augmented business intelligence Hana ett Analytics på SAP, förklarar att Tonya Hall processen och vikten av att göra analytics tillgängliga för mer än bara data forskare.

De flesta affärssystem har en kontingent av fanatiker, människor så genomsyrad av den teknik som de är övertygade om att det är a och o, eller dem som har tagit så många certifieringsprov att det är allt de vet. Älskare av knowledge graph verkar i lite djupare form av övertalning.

“Jag snubblade på tanken av att titta på kompletta nätverk av relationer, i motsats till enskilda delar, och jag blev kär i tanken”, säger Amy Hodler, som är analytics-och AI-program manager för Neo4j, en 12-årig San Francisco start som säljer en databas programmet med samma namn, i vilket objekt som ska redovisas är representerade som “noder” i ett nätverk diagram, sällskap av “kanter” som representerar deras bekantskap.

Hodler är inte bara ett fan av henne företagets arbete, hon är en aficionado av alla saker grafiska, gillar att skriva av grafen forskaren Albert-László Barabasi — “jag har alla hans böcker” – och mer populära namn, såsom James Fowler, som skrev New York Times bestseller Ansluten (“det är en fantastisk bok.”)

hetionet-exploration-sept-13-2019.png

Ett exempel knowledge graph prospektering från Hetionet, ett program som skapats med hjälp Neo4j av UC San Francisco doktorand Daniel Himmelstein.

(Bild: Himmelstein et al.)

Att älska grafen är, hävdar hon, att se något som andra inte har. “Du vet allt om en kråka som flyger, men du skulle inte veta en flock, säger Hodler.

Det finns en poäng med en sådan passion i en värld som fortfarande evangeliserade. Grafdatabaser ännu inte har tagit över. Relationsdatabaser fortfarande väldigt regler hönshus. Och det finns alla typer av andra uppgifter butiker, allt för olika typer av ostrukturerad data, inklusive Hadoop och “No-SQL” publiken.

neo4j-amy-hodler-2019.jpg

Amy Hodler, som är analytics-och AI-program manager för Neo4j, snubblade in på grafteori och grafdatabaser och samtidigt öva analytics. Hon tror att det gör att man kan se på olika sätt.

(Bild: Neo4j)

Men publiken som byggde Neo4j verkar ha gått framåt med entusiasm, med början från den insikt och kanske lite av naivitet.

“Vi var unga och dumma nog att säga låt oss bygga en databas, hur svårt kan det vara, säger Emil Eifrem, grundare och VD för Neo4j. Han och kollegor snubblade på idén när han tjänstgjorde som CTO, fräsch ut i college, för en svensk tech startup, Windh Technologies. Något som bara inte att klicka med användning av relationsdatabaser för ett content management system.

“Jag hade varit programmering för halva mitt liv på den punkten,” han sa, “och i varje projekt, att databasen hade varit en hjälp, en accelerator, något som tog hand om saker för mig, men av någon anledning var det saktar ned oss att gången.”

Det blev klart, säger han, att det var en “mismatch” mellan data och den relationella data struktur för Oracle och Informix. En enterprise content management-system, förklarar Eifrem, är som ett stort filsystem på World Wide Web, med mappar i mappar, och symboliska länkar mellan dem, “en hel del i samband data”, som han uttrycker det. Den rad och kolumn struktur för en relationell databas, med sin “gå med” verksamhet och som, inte klippa det.

Också: “Big data” i aktion: att Använda grafdatabaser att driva kundernas nya insikter

Vad han och kollegorna började bygga på egen hand, vad som skulle bli grunden för ett företag, en databas som kan “modell allt,” Eifrem insisterar, med “tre enkla byggstenar”: Noder, en representation av ett objekt eller en entitet; kanter, linjer som förbinder noderna till en annan; och “nyckel/värde-par,” symboler för att lagra och hämta saker.

De visste det inte då, men ett litet företag som heter Google redan gör hö med detta synsätt, “PageRank” – algoritm som skulle bli grunden för världens största sökmotor. Eifrem hävdar att den centrala inblick bakom PageRank, det som kallas “eigenvector centralitet,” är ett slags släktskap mellan Google och alla andra som bedriver kunskap grafer, inklusive Neo4j.

“Det faktum att de använder i samband data, det är vad vi gör, vi tar den makt som skapat nästan en biljon dollar i börsvärde, och vi tillämpar det klassiska företaget fall, saker som bedrägeri upptäckt och rekommendation motorer.” Eifrem argumenterar för att de “stora Webb-företag” som Google var ett slags första vågen av knowledge graph använda, följt av företagets program använd med Neo4j, och en tredje våg som bara är på väg, med hjälp av diagram för att hjälpa maskininlärning och andra artificiell intelligens-metoder.

Också: grafdatabas återuppfunnit: Dgraph säkrar $11.5 M för att fortsätta med sin unika och påstridig väg

Även om det fortfarande är en liten marknad, enkla, eleganta paradigm av en graf som visar relationer skapar nya fans varje gång det dyker upp i ett program. Finns det några uppmärksammade program redan. Till exempel, Daniel Himmelstein, då verksam som doktorand vid UC San Francisco, skapat en databas av genetiska och molekylära interaktioner, som kallas “Hetionet,” en biologisk information i nätverk som kan användas för att studera möjliga kombinationer av läkemedel. Dess kunskap av noder och kanter ger spektakulära grafer av data som den nedan.

project-rephetio-interaction-illustration.png

En illustration av genen och sammansatta interaktioner i biologi från papper “Heterogena Nätverk Kanten Förutsägelse: En Data Integration Strategi att Prioritera Sjukdom-Associerade Gener” av Daniel S. Himmelstein och Sergio E. Baranzini. Med Neo4j, Himmelstein byggt anslutningar system för att grafiskt rita och representerar interaktioner som kan ha betydelse för sjukdomar och botemedel.

(Bild: Himmelstein et al.)

Bland de omvandlar är några av de mest uppmärksammade unga företag, inklusive spelning ekonomin outfit Lyft. Över tre månader, projektledare Mark Grover och ett team av fyra ingenjörer och en designer skulle kunna få ihop en första version av en metadata-lagret, som kallas “Amundsen,” med Neo4j.

Om du är intresserad av att läsa upp på projektet, Grover och laget har lagt upp ett blogginlägg; – kod är inlagd på Github.

Att inte nödvändigtvis producera licensförsäljning i alla fall, men det bidrar till att vinna hjärtan och sinnen. Förståelse och tillämpning av diagrammet är nya på flera punkter. Googles DeepMind, till exempel, är att undersöka hur grafen kan tjäna som ett medel för att införa “strukturerade representationer” i djupa lärande neurala nätverk. Det kan göra mer sofistikerad AI: s förmåga att konstruera slutsatser från en uppsättning av “byggstenar.”

Till Neo4j folk, detta är alla stadig utveckling av den obevekliga logiken i grafen.

“Jag tror att det är en förändring av tänkande,” för att flytta till grafdatabaser, säger analytics veep Hodler. “Du upplever det som att du börjar titta på grafer.” Hon utger sig för att ha “en enklare tid att förklara grafer för att icke-tekniker” än vad en ingenjör förklara, säg, “tredje normalformen” av en RDBMS att den genomsnittliga personen.

VD Eifrem är ännu mer tydlig i att likna grafen till något som låter som öde.

“AltaVista såg i svart och vitt, och Google såg i färg”, säger han i sökmotorn strider om förr. Likaså “det finns en hel del saker som är anslutna i min värld att jag inte kan arbeta på grund av mina verktyg var att hålla mig tillbaka, nu har jag bara sätta dem i Neo4j, och jag kan göra allt det bra grejer.”

“Det är bara en fråga om tid”, säger han.

Big Data

Nej, detta AI har inte behärskar åttonde klass vetenskap

Från låg-kod och moln, för att AI och kryptering: Vad du gör med den data måste handla om mer än slagord

Frågan om AI för ServiceNow är en fråga om vad som fungerar

Hur MIT försöker lösa AI bias (ZDNet YouTube)

Facebook har en ny integritet verktyg för att skydda din data (CNET)

5 sätt att Vd: ar kan bygga ett motståndskraftigt, data-driven organisation (TechRepublic)

Relaterade Ämnen:

Hantering Av Data

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem