Diagram data standardisering: Det är bara en graf, vilket gör gravitationella vågor i den verkliga världen

0
153

Gör maskininlärning behöver fortfarande människor?
Vijay Raghavan, executive vice president och chief technology officer Risk-och Business Analytics för RELX Grupp, samtal med Tonya Hall om en balans mellan analytics och intuition.

Att få ett antal leverantörer för att prata med varandra, för att inte tala anpassa, är ingen lätt bedrift. Lägga till akademiker och forskare inte nödvändigtvis göra saker och ting lättare. Nu försöker lägga ihop ett splittrat community och länge olösta frågor, och du får bilden av varför grafen data standardisering har inte gjorts hittills.

Också: AI chip unicorn som är på väg att revolutionera allt har datoriserad Graf på sin Kärnverksamhet

Detta verkar dock på väg att ändras, och det är goda nyheter för alla. Vi har noga följt ökningen av grafdatabaser för de senaste par år. Stjärnorna äntligen tycks anpassa för graf, och Gartners och Forresters av världen är att plocka upp på det, också.

Efter att de ingår i Gartners Hype Cycle i augusti 2018, Gartner också ingår Diagram trend som Nr 5 i Topp-10 Data-och Analytics-Teknik Trender för 2019. Diagram glans vid modellering av ett antal domäner, och är det bästa alternativet att utnyttja i samband data. Så varför tog det så lång tid att nå mainstream? För att citera karl ZDNet bidragsgivare och Ägget analytiker Tony Baer:

“Jag kände alltid grafen var bättre lämpad att vara inbäddad under huven eftersom det var en underlig ny databas utan normer de facto eller på annat sätt. Men jag börjar ändra min melodi — alla viktiga data plattform provider nu har antingen en grafdatabas eller API/motor”.

Bingo. Standarder — de facto eller på annat sätt. Tekniken har gjort framsteg, till den punkt där nu med hjälp av diagrammet på skala är möjlig. Men att gå för en del av den etablerade paj utan ett sätt att samverka kan vara utmanande. Fråga bara NoSQL publiken, som slutade i stort sett att anta SQL. Så det är där W3C kommer in.

Fastigheten Grafer och RDF, revisited

W3C arrangerade en workshop på Webben standardisering för graf uppgifter denna vecka i Berlin, med målet att få så mycket av grafen samhälle tillsammans för att diskutera och konvergerar om möjligt standardiseringsarbetet. Workshopen var till stor del driven, och sponsras av Neo4j. Övriga sponsorer var Oracle, Ontotext, och ArangoDB.

Också: Från big data till AI: Där är vi nu, och vad är vägen framåt?

Neo4j är marknadsledande i grafdatabaser, som per DB-Motorer index. Vi har haft ett antal samtal med Emil Eifrem, Neo4j VD, inklusive en förra veckan, precis innan W3C workshop, där Eifrem var orubblig: Standardisering är av högsta prioritet för Neo4j.

Grafen databas landskapet har varit fragmenterad, med egendom grafer och RDF som representerar olika sätt att modellera, lagra och söka efter data, med något standardiserat sätt av interoperabilitet. Medan RDF är standardiserade, egendom grafer är det inte.

Detta har varit till nackdel för grafdatabas antagande, och experter, organisationer och leverantörer, som alla insett detta. W3C Workshop on Web Standardisering för Diagram Data väckt en vem som är vem av grafdatabaser i Berlin för att ta itu med denna fråga.

RDF har funnits i ca 20 år, först som drivs av forskning och den akademiska världen. Som initierats av WWW uppfinnare Sir Tim Berners Lee ‘ s vision om en Semantisk Webb, RDF har en stor stack. Detta stack innefattar sådana saker som resonemang och regler, och det har varit stabil standarder där ett tag nu, inklusive sådana för serialisering, schema och sökfunktionen.

Problemet är dock att pragmatism har inte alltid varit en kärnfråga där. Plus, verktyg för RDF har varit sparsam och inte alltid lätt att använda. Ta JSON-LD, till exempel. Kommer upp med ett standardiserat sätt att serialisera RDF-baserat på JSON, de mest populära format för webb-utvecklare, känns som en no-brainer.

Kombinationen av JSON-LD och schema.org har förmodligen gjort mer för att sprida användningen av RDF än något annat. Att bara få Google och andra sökmotorer att anta att det har lett till en uppsjö av användningsfall. Och ändå, JSON-LD var väldigt kontroversiell på sin tid i RDF gemenskapen. Detta var inte den sista kontroverser SÄGA att gemenskapen inför, men det verkar som JSON-LD ‘ s framgång kan ha haft något att lära. Men vi återkommer till det inom kort.

Fastigheten grafer har funnits i ca 10 år, och har varit driven av industrin. Som sådan, man kan säga att de är en omvänd spegelbild av RDF: Pragmatism regler, tooling är riklig och lätt att använda, uppsökande verksamhet och för att bygga en gemenskap av högsta prioritet, men standardisering bara kom som en eftertanke på denna punkt.

De flesta egendom diagram lösningar inte har ett schema, eller har en mycket grundläggande schema. Bara att få data i och ut ur fastigheten diagram lösningar är en övning i tålamod och improvisation — lycka till företräder en graf struktur i CSV-och kartläggning som från lösning till en lösning. Det finns inget standardiserat frågespråk för egendom grafer. Och det finns inget sådant som en abstrakt modell, eller semantik, för egendom grafer på denna punkt heller.

En gravitationell våg ögonblick

Nu, inget av det är olösbara. För fastigheten diagram världen, att komma överens om lite sunt förnuft serialisering format, kommer upp med en syntes av befintlig fråga språk, och arbetar på en fastighet diagram modell som kommer att aktivera schemat och semantik definition som alla ser som rimligt steg att ta. Goda nyheter då: Det verkar som att det är precis vad som är på agendan, så vi kan förvänta oss att dessa åtgärder ska genomföras.

Också: Sammanflytande visar öppen källkod, paradigmskiften, moln, och kommersiell framgång kan samexistera

Så vad står på spel för RDF världen då, i vilket alla som redan finns? En väl regisserad metafor som används i W3C workshop för att beskriva status är som en bro. Att bygga broar var det viktigaste temat för evenemanget trots allt. Att bygga broar mellan egendom diagram är en sak, men vad händer om broar mellan egendom grafer och RDF?

Medan egendom grafer har arbete att göra för att bygga pelare för denna bro till RDF världen, i RDF-pelarna är oftast det, förutom en sak: reification. Om du inte är i RDF, reification är något du har förmodligen aldrig hört talas om, och verkligen inte bryr sig om heller. Men det är nyckeln för att bygga bron till fastigheten diagram världen, och det verkar som att RDF är äntligen komma nära för att lösa detta.

w3cworkshop.jpg

Gå W3C workshop på grafen standardisering har varit en intressant upplevelse.

Reification är mekanismen för att lägga till egenskaper till RDF-grafen kanter, vilket gör dem direkt översättningsbara till egendom grafer. Även om detta är möjligt, upp till nu har det inte varit en standard, överenskommet sätt att göra detta. RDF* är ett förslag på hur man kan göra detta, som infördes i och med 2014, vilket är att få fäste i RDF världen.

Ett av resultaten av W3C workshop var praktiskt taget enhälligt begrepp att göra detta till en W3C-specifikation. Denna teknikalitet, eller red herring som vissa människor kallade det, har varit att avstanna RDF gemenskapen under en lång tid. Titta på detta för att slutligen åt sidan, förhoppningsvis för gott, påminner om att kontot kända sociologen Harry Collins ger på den gravitationella fysiker gemenskapen.

I sin bok, Artifictional Intelligens, Collins ger sig ut på en beskrivning av hur människor konstruerar mening socialt. Som en fallstudie, han använder den gravitationella fysik gemenskapen, i vilket han har varit inbäddade, och deras konvergens runt gravitationella våg experimentella bevis 2015. Titta på den RDF community konvergera kring RDF* har varit liknande på många sätt.

Det är bara en graf, som gör vågor i den verkliga världen

Det återstår att se om RDF* kan vara avgörande för RDF, och graf i stort, som gravitationsvågor har varit för fysik. Potential och dynamik är verkligen det, och människor i W3C workshop verkar ha kvar med engagemang för att fortsätta arbeta på dessa pelare och broar.

Även: Starta omskolning revolution utan mig: Framtida Arbete trender och mjuka data på mjuka färdigheter

I den under tiden, men grafen är som gör vågor i den verkliga världen. I slutet, som Brad Bebee från AWS Neptunus sätta det i sin keynote, det är bara en graf. Användare som egentligen inte bryr sig om de underliggande tekniska; de är att få upp farten med det faktum att “graphs låt oss integrera data som galen.”

Neptunus är en molnbaserad grafdatabas från AWS, som låter användarna använda både RDF och egendom grafer, och skulle gynnas enormt av att ha dessa broar är på plats. Som Bebee påpekade, Neptunus har varit bland de mest populära AWS produkter 2018. Detta talar sitt tydliga språk, men det är inte allt som är nytt i grafdatabas världen.

maxresdefaultjpg.jpg

Grafen är att få allvar, och som gör vågor i den verkliga världen.

Du kanske har hört talas om Neo4j senaste finansiering omgång: $80 miljoner, den i särklass största investeringen i detta utrymme fram till nu. Att diskutera en färdplan för att göra det bästa av det här med Eifrem, tre prioriteringar betonas: Standardisering, moln, och trappa upp. Vi har redan utarbetats på standardisering, så låt oss bara tillägga att det finns ytterligare broar som arbetade på ISO och SQL insatser.

Men vad om cloud och trappa upp? Neo4j inte erbjuder en managed cloud-version på denna punkt. Eftersom detta är att få vara insatser för varje databas lösning, Neo4j arbetar med detta. Eifrem sade en managed cloud version av Neo4j baserat på Kubernetes är för närvarande i privat beta, feedback är bra, och allmän tillgänglighet kommer snart.

Plus, Neo4j kommer att göra en betydande mängd av anställer i den kommande perioden. Ganska oglamorösa, men i högsta grad behövs insatser för att göra detta och skala upp, är vad det är som håller Eifrem upptagen. Så inte så många skinande nya leksaker att visa, för nu, men Eifrem hänvisade till mer om detta kommer snart. I tiden, men andra leverantörer för att öka deras spel också.

Typexempel, RDF leverantörer att lägga till stöd för egendom grafer. AWS redan har detta, Cambridge Semantik och Stardog är att lägga till det också. Plus, multi-modellen stöd, och JSON som en del av detta, är att bli en viktig funktion för många leverantörer. JSON-LD har öppnat dörren, och i sedan ett par månader leverantörer som AllegroGraph och Ontotext har lagt till stöd för JSON, också. Vi kommer tillbaka med mer djupgående analys av detta utrymme snart.

Tidigare och relaterade täckning:

För CockroachDB, transaktioner först, sedan analytics är en feature, inte en bugg

En databas med öppen källkod som är segt, stöder automatisk geo-skalning på plats och i molnet, och SQL. CockroachDB redan är allt detta. Nästa i färdplanen: Analytics, med Hybrid Transaktions-Analytisk Bearbetning.

Öppen källkod AI marker att göra Gröna Vågor: att Föra energieffektivitet till IoT-arkitektur

Vad händer om maskinen lärande program på kanten var möjligt att tänja på gränserna av storlek och energieffektivitet? GreenWaves gör detta, som bygger på en öppen källkod parallella ultra low power processor-arkitektur. Även om det är tidiga dagar, konsekvenser för sakernas internet, arkitektur och energieffektivitet kan vara dramatisk.

2019 kommer att vara ett År av Grafen’: OpenCorporates är bevis Nr 1

Grafdatabaser är crossing the chasm att använda vanliga fall, att lägga till funktioner såsom lärande i sin arsenal och bli mer moln och utvecklare vänliga. Förra året var en utbrytning år, och grafdatabas tillväxten och utvecklingen är på god väg i och med 2019.

Relaterade Ämnen:

Big Data Analytics

Innovation

CXO

Artificiell Intelligens

Affärssystem

Förvaring