Nul
Viden grafer er hyped. Vi kan officielt sige, at det nu, da Gartner i prisen viden grafer i 2018 hype cycle for emerging technologies. Selvom vi ikke har til at vente, til Gartner — erklære dette som “Year of the Graph” var vores åbner i 2018. Ligesom alle, der er aktive på området, ser vi mulighed for, samt truslen i dette: Med hype kommer forvirring.
Viden grafer er reelle. De har været i de sidste 20 år, mindst. Viden grafer, i deres oprindelige definition og inkarnation, har været viden om repræsentation og argumentation. Ting, som kontrollerede vokabularer, taksonomier, skemaer, og ontologier har alle været en del af dette, der er bygget på et Semantisk Web fundament af standarder og praksis.
Også: Planet analytics 1.0: Fra FN ‘ s laboratorium for at kloden
Så, hvad er ændret? Hvordan kommer de kan lide af Airbnb, Amazon, Google, LinkedIn, Uber, og Zalando sport viden grafer i deres kerneforretning? Hvordan kommer Amazon og Microsoft sluttede sig til den skare af graf-database leverandører med deres nyeste produkter? Og hvordan kan du gøre dette arbejde?
Viden grafer, før de var cool
Viden, grafer, lyd, cool og det hele. Men hvad er det præcist? Det kan lyde som et naivt spørgsmål, men rent faktisk at få definitioner ret er, hvordan du opbygger en viden graf. Fra skatteafgift at ontologier — det væsentlige, skemaer og regler af varierende kompleksitet — det er, hvordan folk har gjort det i årevis.
RDF, den standard, der bruges til at indkode disse skemaer, er en graf struktur. Så ringer viden kodet på toppen af en graf struktur en “knowledge graph” lyder naturligt. Og de folk der gør dette, er de data, modelbyggere, som har været såkaldte viden ingeniører, eller ontologists.
Også: AWS Neptun vil GA: den gode, Den onde og den grusomme til graf-database-brugere og leverandører
Der kan være mange ansøgninger til disse viden grafer — fra bibliografiske poster, til data integration og publicering på nettet, til komplekse argumentation. For nogle af de mest fremtrædende af dem, du kan se på schema.org, Airbnb, Amazon, Diffbot, Google, LinkedIn, Uber, og Zalando. Dette er hvorfor folk krydret med viden grafer vrænger på den hype.

Så, viden grafer er i den Hype cycle for emerging technologies nu. Ikke dårligt for en teknologi med mere end 20 års historie. (Billede: Gartner)
Ligesom alle data modellering, det er svært og kompliceret arbejde. Det skal tage hensyn til mange interessenter og syn på verden, styre herkomst og skema drift, og så videre. Føje til mix argumentation, og web-skala, og tingene kan let komme ud af hånden, hvilket kan forklare, hvorfor op, indtil for nylig, at denne fremgangsmåde ikke var de mest populære i den virkelige verden.
Gå skema-mindre, på den anden side, har været og stadig er populære. Gå skema-mindre kan få dig i gang hurtigt, og det er enklere og mere fleksibelt, i det mindste indtil et vist punkt. Den enkelhed af ikke at bruge et skema kan snyde selv. Fordi, i den sidste ende, uanset hvad dit domæne, et skema vil eksistere. Skema-på-læse? Fint. Men ikke skema på alle?
Også: GraphQL for databaser: Et lag for universal database adgang?
Du kan ikke vide, at dit skema, godt nok på forhånd. Det kan være kompleks, og det kan udvikle sig. Men det vil eksistere. Så, ignorere eller bagatellisere skema løser ikke noget problem, det gør kun tingene værre. Spørgsmål vil lure, og koste dig tid og penge, som de vil hæmme udviklere og analytikere, der vil forsøge at udvikle applikationer og udlede indsigter på en tågeplet af data.
Det punkt, så er det ikke for at kaste skema væk, men for at gøre det funktionelle, fleksible, og udskiftelige. RDF er temmelig god til det, som det også ligger til grund for standardiserede formater til udveksling af data, som JSON-LD. RDF kan også bruges til let skema i og skema-mindre tilgange, og data integration, ved den måde.
At få viden ind i eller ud af grafer
Så, hvad er der med den hype? Hvordan kan en 20 år gammel teknologi, der kan være på den nye hældning af den famøse hype-cyklus? Hype er virkelig også, som er årsagen til dette. Det er den samme historie som den rivende anledning af AI hype: Det er ikke så meget, at tingene har ændret sig i den tilgang, det er mere, at de data og beregne strøm, er der nu for at gøre det arbejde på skalaen.
Plus, AI sig selv medvirker. Eller, for at være mere præcis, den slags bottom-up, machine learning-baseret AI, der får den hype i disse dage. Viden grafer er i bund og grund AI, også. Bare en anden form. Ikke nogle hyped-up-to-nu AI, men det symbolske, top-down, regel-baseret form. Den hidtil upopulære slags.
Det er ikke, at denne tilgang ikke har sine begrænsninger. Det er svært at indkode viden om komplekse domæner på en funktionel måde, og at grunden til, om det på en skala. Så, machine learning måde at gøre tingene på, ligesom skemaet-mindre vej, fik populære. Og med god grund, for.
Viden Grafer kan være svært i starten, men giv ikke op. Praksis gør perfekt.
Med big data eksplosion, og en stigning i antallet af NoSQL, noget andet startede sker, også. Værktøjer og databaser for ikke-RDF grafer dukkede op i markedet, og begyndte at finde succes. Disse grafer, af mærket ejendom form (LPG), er enklere og mindre detaljeret. De enten mangler skema, eller har grundlæggende skema kapacitet i forhold til RDF.
Og at de typisk klarer sig bedre, for de operationelle programmer, graf algoritmer, eller graf analytics. Sidst, grafer er begyndt at blive brugt for machine learning. Disse er alle meget nyttige ting.
Algoritmer, analytics og machine learning kan give indsigt i grafer, med nogle fælles brug sager, der afsløring af svig eller anbefalinger. Man kan derfor sige, at sådanne teknikker og programmer, få viden ud af grafer, bottom-up. RDF grafer på den anden side få viden ind i grafer, top-down.
Så er bottom-up grafer viden grafer, også?
Også: det går hurtigt uden at bryde data: Styring til styring af risici i machine learning og uden
Som en viden ingeniør vil sige, det er et spørgsmål om semantik. Det er fristende at ride den viden grafen hype. Men i sidste ende, manglende klarhed kan vise sig for lidt service. Graf algoritmer, analytics graf, og graf-baseret maskine, læring og indsigt er alle gode, præcise vendinger. Og de er ikke gensidigt udelukkende med “traditionelle” viden grafer.
Alle de fremtrædende use cases vi har tidligere nævnt, er baseret på en kombination af metoder. At have en viden graf og befolker det bruger machine learning for eksempel har været med til at bygge den største viden graf nogensinde-i det mindste i form af tilfælde, hvis der ikke er enheder. Og det er, hvad AI-pionerer som DeepMind er forsker, så godt.
Nogle ting, gamle, nogle nye ting, og nogle ting, der er lånt til graf databaser
Som sædvanlig, valg af metode og værktøj til at bruge til din graf, afhænger af dine use case. Dette gælder også for graf databaser, som vi har været tæt overvågning, som de udvikler sig, med nye leverandører og kapaciteter bliver tilføjet hurtigt.
I sidste uge på Lag, både vinder og runner-up til den Mest Forstyrrende Startup award blev graf databaser: TigerGraph og Memgraph. I tilfælde af at du brug for mere bevis for, hvor hurtige fremskridt, der er gjort i området, der har du det. Både nystartede er ikke mere end et par år gammel, ved den måde.
For TigerGraph, der kom ud af stealth i September 2017, dette har været et meget aktivt år. I dag, TigerGraph annoncerer en ny udgivelse. Og det har fået nogle ting, gamle, nogle nye ting, og nogle ting, der er lånt — men vi kunne ikke rigtig få øje på noget blåt.
Top-down eller bottom-up? Få viden i eller ud af grafer? (Billede: Organisatoriske Fysik)