Graf data standardisering: Det er bare en graf, hvilket gør gravitationelle bølger i den virkelige verden

0
202

Er machine learning stadig behov for folk?
Vijay Raghavan, executive vice president og chief technology officer Risiko-og Business Analytics for RELX Gruppe, samtaler med Tonya Hall om en balance mellem google analytics og intuition.

Få en række leverandører til at tale med hinanden, endsige bringe, er ingen let sag. Tilføjelse af akademikere og forskere, der ikke nødvendigvis gør tingene lettere. Nu du prøver at føje til mix et fragmenteret samfund og langvarige konflikter, og du får et billede af, hvorfor grafen data standardisering ikke er nået så langt.

Også: AI chip enhjørning, der er ved at revolutionere alt har beregningsmæssige Graf i sin Kerne

Dette, ser det dog ud ved at ændre sig, og det er gode nyheder for alle. Vi har nøje fulgt den stigende graf databaser for de seneste par år. De stjerner, der synes at være en endelig tilpasning til grafen, og den Gartners og Forresters af verden er at samle op på dette.

Efter at være blevet inkluderet i gartners Hype-Cyklus i August 2018, Gartner også inkluderet Graf som tendens No. 5 til i Top 10 Data og Analytics-Teknologi Tendenser til 2019. Grafer skinne i modellering for en række domæner, og er den bedste mulighed for at udnytte tilsluttet data. Så hvorfor tog det så lang tid at nå mainstream? For at citere kolleger ZDNet bidragyder og Æg analytiker Tony Baer:

“Jeg har altid følt graf, der var bedre egnede, der er indlejret under kølerhjelmen, fordi det var en mærkelig ny database uden standarder, de facto eller på anden måde. Men jeg begynder at ændre min melodi — alle vigtige data platform udbyder har nu enten en grafdatabase eller API/motor.”

Bingo. Standarder — de facto eller på anden måde. Teknologien har gjort fremskridt, til det punkt, hvor nu ved hjælp af grafen på skalaen er muligt. Men de går til et stykke af den etablerede pie uden en måde til at fungere kan være udfordrende. Bare spørg NoSQL publikum, som endte med stort set at vedtage SQL. Så dette er, hvor W3C kommer i..

Ejendom Grafer og RDF, revisited

W3C arrangeret en workshop på Web-standardisering af graf over data i denne uge i Berlin, med det formål at få så meget af grafen for fællesskabet sammen for at diskutere og konvergere på mulig standardisering indsats. Værkstedet var i vid udstrækning drevet, og sponsoreret af Neo4j. Andre sponsorer var Oracle, Ontotext, og ArangoDB.

Også: Fra big data AI: Hvor er vi nu, og hvad er vejen frem?

Neo4j er markedsleder i grafen databaser, som per DB-Motorer indeks. Vi har haft en række samtaler med Emil Eifrem, Neo4j ‘ s administrerende DIREKTØR, herunder en i sidste uge, lige før W3C workshop, hvor Eifrem var ubøjelig: Standardisering er en top-prioritet for Neo4j.

Grafen database landskab er blevet fragmenteret, med ejendom, grafer og RDF, der repræsenterer forskellige måder til model, gemme og forespørge på data, med nogen standard måde at sikre interoperabilitet. Mens RDF er standardiseret, ejendom grafer er ikke.

Dette har været til skade for Graf-database vedtagelse, og eksperter, standardiseringsorganer og leverandører, alle indset dette. W3C Workshop på Web-Standardisering af Graf over Data, der bragte en hvem er hvem af grafen databaser i Berlin for at løse dette problem.

RDF har eksisteret i omkring 20 år, i første omgang drevet af forskningen og den akademiske verden. Indledt af WWW opfinder Sir Tim Berners Lee ‘ s vision om et Semantisk Web, RDF har en stor stack. Denne stak omfatter ting som argumentation og regler, og der har været stabile standarder, der i et stykke tid nu, herunder dem, der for serialisering, skema, og søgninger.

Problemet er imidlertid, at pragmatisme har ikke altid været et centralt problem der. Plus, værktøj til RDF har været sparsom, og ikke altid er let at bruge. Tage JSON-LD, for eksempel. Kommer op med en standard måde at serialisere RDF-baseret på JSON, det mest populære format til web-udviklere, der synes som en no-brainer.

Kombinationen af JSON-LD og schema.org har sandsynligvis gjort mere for at udbrede brugen af RDF end noget andet. Bare at få Google og andre søgemaskiner til at vedtage det har ført til en række use cases. Og alligevel, JSON-LD var yderst kontroversiel i sin tid i RDF fællesskabet. Dette var ikke den sidste kontrovers RDF samfund står over for, men det ser ud som JSON-LD ‘ s succes, kan have haft noget at lære. Men vi vil komme tilbage til om lidt.

Ejendom grafer har været omkring for omkring 10 år, og har været drevet af industrien. Som sådan kan man sige, at de er et omvendt spejlbillede af RDF: Pragmatisme, regler, værktøjer er rigelig og let at bruge, opsøgende og community building er en topprioritet, men standardisering kun kom som en eftertanke på dette punkt.

De fleste ejendomme graf løsninger ikke har et skema, eller har en meget grundlæggende skema. Bare at få data ind og ud af ejendommen graf løsninger er en øvelse i tålmodighed og improvisation — held og lykke, der repræsenterer en graf struktur i CSV og kortlægning, fra løsning til løsning. Der er ingen standard query language for ejendom grafer. Og der er ikke sådan noget som en abstrakt model, eller semantik, for ejendom grafer på dette punkt.

En gravitationel bølge øjeblik

Nu, er der ingen af, der er uløselige. Til ejendommen graf verden, at blive enige om nogle fælles følelse serialisering format, kommer op med en syntese af eksisterende query sprog, og arbejder på en ejendom graf model, der vil gøre det muligt for skema og semantik definition alle ligner rimelige skridt at tage. En god nyhed så: Det lader til, at præcis, hvad der er på dagsordenen, så vi kan forvente, at disse skridt gennemføres.

Også: Sammenflydende viser, open source, paradigmeskift, cloud, og kommercielle succes, alle kan co-eksistere

Så hvad er på spil for RDF verden dengang, hvor alle, der allerede findes? Et velrettet metafor, der anvendes i W3C-værksted for at beskrive status er, at en bro. Brobygning var det vigtigste tema af begivenheden, efter alle. Bygge broer mellem ejendom grafer er én ting, men hvad med broer mellem ejendom grafer og RDF?

Mens ejendom grafer, der har et arbejde at gøre i opbygningen af grundpillerne for denne bro til RDF verden, i RDF-søjlerne er for det meste der, bortset fra én ting: reification. Hvis du ikke er til RDF, reification er noget du har sandsynligvis aldrig hørt om, og ikke virkelig bekymrer sig om enten. Men det er nøglen til at bygge bro til den ejendom graf verden, og det ser ud som RDF er endelig at komme tæt på at løse dette.

w3cworkshop.jpg

Deltager W3C workshop på grafen standardisering har været en interessant oplevelse.

Reification er mekanismen for at tilføje egenskaber til RDF graf kanter, hvilket gør dem direkte oversættes til ejendom grafer. Selv om dette er muligt, op til nu har der ikke været en standard, der er aftalt måde at gøre dette på. RDF* er et forslag på, hvordan du gør dette, indført i 2014, der er få trækkraft i RDF verden.

Et af resultaterne af W3C workshop var næsten enstemmige opfattelse at gøre dette til en W3C-specifikation. Denne teknikalitet, eller rød sild, som nogle mennesker kaldte det, har været henholdende RDF i lang tid. Ser det endelig ud på et sidespor, forhåbentlig til gode, blev der minder om den konto, kendt sociolog Harry Collins giver på den gravitationelle fysiker fællesskabet.

I sin bog, Artifictional Intelligens, Collins begiver sig ud på en beskrivelse af den måde, folk konstruere mening socialt. Som et casestudie, han bruger den gravitationelle fysik fællesskab, som han er blevet indlejret i, og deres konvergens omkring gravitationel bølge eksperimentelle beviser i 2015. Se RDF fællesskab konvergerer omkring RDF* har været ligner på mange måder.

Det er bare en graf, der gør bølger i den virkelige verden

Det er endnu uvist, om RDF* kan være så afgørende for, RDF, og grafen på stor, som gravitationsbølger, der har været til fysik. Den potentielle og dynamikken er helt sikkert der, og folk i W3C workshop synes at have efterladt med en forpligtelse til at fortsætte med at arbejde på disse søjler og broer.

Også: Start omskoling revolution uden mig: Fremtidige Arbejde tendenser og bløde data på de bløde kvalifikationer

I mellemtiden, dog graf, der gør bølger i den virkelige verden. I den ende, som Brad Bebee fra AWS Neptun sætte det i sin keynote, det er bare en graf. Brugerne behøver ikke virkelig bekymrer sig om de underliggende tekniske; de er komme op i fart med det faktum, at “grafer lad os integrere data som en sindssyg.”

Neptun er en cloud-baseret graf-database fra AWS, som giver brugerne mulighed for at bruge både RDF og ejendom grafer, og ville nyde uhyre, der har disse broer på plads. Som Bebee påpeget, Neptun har været blandt de mest populære AWS produkter i 2018. Dette taler for sig selv, men det er ikke alt, der er nyt i den grafdatabase verden.

maxresdefaultjpg.jpg

Grafen er at få tyngdekraften, og gør bølger i den virkelige verden.

Du har måske hørt om Neo4j ‘ s seneste finansiering runde: $80 millioner, langt den største investering i dette rum, indtil nu. At diskutere køreplan for at gøre det bedste ud af dette med Eifrem, tre prioriteter, der blev fremhævet: Standardisering, cloud, og opskalering. Vi har allerede udarbejdet på standardisering, så lad os bare tilføje, at der er flere broer, der arbejdes på at ISO og løbende SQL indsats.

Men hvad om cloud og opskalering? Neo4j ikke tilbyder en managed cloud-version på dette punkt. Som det bliver at være indsatser for enhver database løsning, Neo4j arbejder på det. Eifrem sagde en managed cloud-version af Neo4j baseret på Kubernetes er i øjeblikket i private beta, feedback er god, og den generelle ledighed kommer snart.

Plus, Neo4j vil gøre en betydelig mængde af ansættelser i den kommende periode. Den helt glamourøse, men en hårdt tiltrængt indsats for at gøre dette, og skalere virksomheden op, er, hvad der er at holde Eifrem travlt. Så ikke, at mange skinnende nye legetøj at vise frem, for nu, men Eifrem hentydede til, af mere om dette kommer snart. I mellemtiden, men andre producenter er ved at optrappe deres spil.

Sag i punkt, RDF leverandører tilføje understøttelse for ejendom grafer. AWS allerede har dette, Cambridge Semantik og Stardog er ved at tilføje det så godt. Plus, multi-model støtte, og JSON som en del af dette, er ved at blive en vigtig funktion for mange leverandører. JSON-LD har åbnet døren, og i de sidste par måneder leverandører som AllegroGraph og Ontotext har tilføjet support til JSON. Vi vil vende tilbage med en mere dybdegående analyse af denne plads snart.

Tidligere og relaterede dækning:

For CockroachDB, transaktioner først, så kan analytics er en funktion-ikke en fejl

En open-source database, som er robuste, og som understøtter automatisk geo-skalering on-premise og i skyen, og SQL. CockroachDB allerede er alt det der. Næste i køreplanen: Analytics, med Hybrid Transaktionsbeslutning Analytisk Behandling.

Open source AI chips at gøre Grønne Bølger: at Bringe energi effektivitet til at IoT arkitektur

Hvad hvis machine learning programmer på kanten var muligt, at skubbe grænserne for, størrelse og energieffektivitet? GreenWaves gør dette, baseret på en open source parallel-ultra low power processor arkitektur. Selvom det tidlige dage, konsekvenser for IoT arkitektur og energi-effektivitet kan blive dramatiske.

I 2019 vil være en anden ‘År af Grafen’: OpenCorporates er dokumentation for, No. 1

Graf databaser er at krydse kløften for at integrere use cases, tilføje funktioner, såsom machine learning til deres arsenal og bliver mere sky og udvikler venligt. Sidste år var en breakout år, og graf-database vækst og udviklingen er godt på vej i 2019.

Relaterede Emner:

Big Data Analytics

Innovation

CXO

Kunstig Intelligens

Virksomhedens Software

Opbevaring