Nul
Kennis grafieken zijn hyped. Kunnen We officieel zeggen dat dit nu, sinds Gartner opgenomen kennis grafieken in 2018 de hype cycle for emerging technologies. Al hebben we niet te wachten voor Gartner — verklaren dit als het “Jaar van de Grafiek” was onze opener voor 2018. Zoals iedereen in het veld zien we de gelegenheid, evenals de dreiging in deze hype komt verwarring.
Kennis grafieken real. Ze zijn de afgelopen 20 jaar op zijn minst. Kennis van grafieken, in hun oorspronkelijke definitie en incarnatie, zijn kennis over de vertegenwoordiging en redeneren. Dingen zoals gecontroleerde woordenlijsten, taxonomieën, schema ‘ s, en ontologieën zijn allemaal onderdeel van deze, gebouwd op een Semantisch Web stichting van de normen en praktijken.
Ook: Planeet analytics 1.0: Van de VN-lab de hele wereld
Dus, wat is er veranderd? Hoe komt het dat de wil van Airbnb, Amazon, Google, LinkedIn, Uber, en Zalando sport kennis grafieken in hun core business? Hoe komt het dat Amazon en Microsoft lid van de menigte van de grafiek database-leveranciers met hun nieuwste producten? En hoe kan je dit werk?
Kennis grafieken voordat ze cool waren
Kennis van grafieken, het klinkt zo cool en al. Maar wat zijn ze precies? Het klinkt misschien als een naïeve vraag, maar eigenlijk om de definities rechts is hoe bouw je een knowledge graph. Van taxonomieën te ontologieën — wezen, schema ‘ s en regels van uiteenlopende complexiteit-dat is wat mensen doen dit al jaren.
RDF, de standaard voor het coderen van deze schema ‘ s, heeft een grafiek structuur. Dus, bellen kennis gecodeerd op de top van een grafiek structuur een “knowledge graph” natuurlijke geluiden. En de mensen die het werk doen, de gegevens modelmakers, zijn zogenaamde kennis ingenieurs, of ontologists.
Ook: AWS Neptunus gaat GA: De goede, de slechte en de lelijke grafiek voor gebruikers van de database en leveranciers
Er zijn vele toepassingen voor deze kennis grafieken — van bibliografische items, data-integratie en het publiceren op het web, om complexe redenering. Voor sommige van de meest prominente, kunt u kijken op schema.org, Airbnb, Amazon, Diffbot, Google, LinkedIn, Uber, en Zalando. Dit is de reden waarom mensen ervaren in kennis grafieken afgeven op de hype.

Dus, kennis grafieken zijn in de Hype cycle for emerging technologies nu. Niet slecht voor een technologie met meer dan 20 jaar geschiedenis. (Afbeelding: Gartner)
Als alle data modeling, dit is moeilijk en ingewikkeld werk. Het moet rekening houden met veel belanghebbenden en het uitzicht van de wereld, het beheren van de herkomst en de schema drift, en dus op. Voeg aan de mix redenering, en web-schaal, en de dingen zo uit de hand, wat kan verklaren waarom het tot voor kort, deze aanpak is niet de meest populaire in de echte wereld.
Gaat schema-minder, aan de andere kant, was en is nog steeds populair. Gaat schema-minder kan je snel aan de slag; het is eenvoudiger en flexibeler, tenminste tot een bepaald punt. De eenvoud van het niet gebruiken van een schema kan misleidend zijn. Omdat op het einde, wat uw domein, een schema zal bestaan. Schema-op-lezen? Fijn. Maar geen schema?
Ook: GraphQL voor databases: Een laag voor universele toegang tot de database?
Weet u niet uw schema goed genoeg a priori. Het complex kan zijn, en het kan evolueren. Maar het zal bestaan. Dus, het onvoldoende onderkennen van schema lost geen enkel probleem, het maakt alleen maar erger. Problemen op de loer liggen, en het kost u tijd en geld, want ze belemmeren ontwikkelaars en analisten die zal proberen om toepassingen te ontwikkelen en zo inzicht te verkrijgen op een vage vlek van gegevens.
Het punt is dan niet om te gooien schema afstand, maar om het functionele, flexibele, en uitwisselbaar. RDF is redelijk goed in dit, als het ook ten grondslag ligt aan gestandaardiseerde formaten voor de uitwisseling van gegevens, zoals JSON-LD. RDF kan ook worden gebruikt voor lichtgewicht schema en het schema-minder benaderingen, en data-integratie, door de manier waarop.
Het verkrijgen van kennis in of uit grafieken
Dus, wat is er met de hype? Hoe kan een 20-jaar oude technologie worden op de opkomende helling van de beruchte hype cycle? Hype is echt, ook als is de reden voor deze. Het is hetzelfde verhaal als de snelle opkomst van de AI-hype: Het is niet zo dat de dingen zijn veranderd in de aanpak, het is meer dat de gegevens en het berekenen van macht zijn er nu om het te laten werken op schaal.
Plus, de AI zelf helpt. Of, om meer precies te zijn, de aard van de bottom-up -, machine learning-based AI, dat wordt de hype van deze dagen. Kennis grafieken zijn in wezen AI, ook. Gewoon een andere soort. Geen enkele hyped-up-to-nu AI, maar de symbolische, top-down, regel-gebaseerde soort. De tot nu toe impopulaire soort.
Het is niet dat deze aanpak niet zijn beperkingen hebben. Het is moeilijk te coderen kennis over complexe domeinen op een functionele manier, en reden over het op schaal. Dus, de ‘machine learning’ manier van doen, net als de schema-minder manier, kreeg populair. En om goede redenen ook.
Kennis van Grafieken kan moeilijk op het eerste, maar geef niet op. Oefening baart kunst.
Met de big data-explosie, en de opkomst van NoSQL, iets anders begonnen gebeurt ook. Tools en databases voor niet-RDF grafieken verscheen in de markt, en begon met het zoeken naar succes. Deze grafieken, van de gelabelde goederen soort (LPG), zijn eenvoudiger en minder uitgebreid. Ze missen ofwel schema, of basic schema mogelijkheden ten opzichte van RDF.
En ze meestal beter presteren voor operationele toepassingen, grafiek algoritmen of grafiek analytics. De laatste tijd, grafieken beginnen te worden gebruikt voor machine learning, ook. Deze zijn alle zeer nuttige dingen.
Algoritmen, analyse en machine learning kan bieden inzicht in grafieken, met sommige situaties wordt de opsporing van fraude of aanbevelingen. Je zou dus zeggen dat deze technieken en toepassingen kennis van grafieken, bottom-up. RDF grafieken aan de andere kant krijgen kennis in grafieken, top-down.
Dus, bottom-up grafieken kennis grafieken?
Ook: snel Bewegen zonder te breken gegevens: Governance voor het managen van risico ‘ s in machine learning en buiten
Als een knowledge engineer zou zeggen, het is een kwestie van semantiek. Het is verleidelijk om te rijden de knowledge graph hype. Maar in het einde, het ontbreken van duidelijkheid zou kunnen blijken van weinig service. Grafiek algoritmen, grafiek analytics, en de grafiek op basis van machine learning en inzichten zijn allemaal goede, nauwkeurige voorwaarden. En ze zijn niet wederzijds exclusief met de “traditionele” kennis grafieken.
Alle prominente use cases die we al eerder vermeld zijn gebaseerd op een combinatie van benaderingen. Het hebben van een knowledge graph en het vullen van het gebruik van machine learning bijvoorbeeld heeft geholpen met het bouwen van de grootste knowledge graph ooit-op zijn minst in termen van de gevallen als niet-entiteiten. Wat de AI-pioniers als DeepMind onderzoeken.
Sommige oud, sommige dingen zijn nieuw, sommige dingen geleend voor graph databases
Zoals gebruikelijk, is de keuze van de aanpak en tool om te gebruiken voor uw grafiek is afhankelijk van uw gebruik. Dit geldt ook voor grafische gegevensbestanden, die we nauwlettend in de gaten als ze zich ontwikkelen, met nieuwe leveranciers en mogelijkheden toegevoegd snel.
Vorige week op Lagen, zowel de winnaar en de runner-up voor de Meest Ontwrichtende Startup award waren graph databases: TigerGraph en Memgraph. In het geval u het nodig is meer een bewijs van hoe snel de vooruitgang in het veld, daar heb je het. Zowel startups zijn niet meer dan een paar jaar oud is, door de manier waarop.
Voor TigerGraph, die kwam uit stealth in September 2017, dit is een zeer actief jaar. Vandaag, TigerGraph is de aankondiging van een nieuwe release. En het sommige oud, sommige dingen zijn nieuw, sommige dingen geleend — maar we konden niet echt een plek iets blauw.
Top-down of bottom-up? Het verkrijgen van kennis in of uit de grafieken? (Afbeelding: De Organisatie Natuurkunde)