för Stora på Data
| November 26, 2019 — 13:00 GMT (13:00 GMT)
| Ämne: Big Data Analytics

Med re:Invent på tryck till på nästa vecka, Internet kommer att vara full med AWS meddelanden. Med en rad tillkännagivanden förra månaden, Neptunus, Amazons grafdatabas, inte hog rampljuset nästa vecka. Men det är knappast eftersom plattformen har stått stilla.
Med Neptunus i produktion i nästan ett och ett halvt år, var vi intresserade av att se vilken typ av att ta upp det har haft, särskilt med tanke på att det är sällsynt exempel på ett diagram data plattform som stödjer både den äldre Resource Description Framework (RDF) – modell som kom ut av den semantiska webben, och de nyare egendom diagram modell som uppfanns av Neo4J, som har blivit standard standard för de flesta nya grafen poster i databasen.
Det finns en god anledning till att AWS gick in på denna marknad.
Stora på Data bro George Anadiotis har bott grafen dröm, och dokumenterat hans liv av diagrammet i ett djupt dyk rapport som han publicerade för drygt ett år sedan. Medan vi inte gå så långt som George i att säga att vi är i “året av grafen,” vi kommer att säga att där det finns rök, det finns eld, och det har varit mycket av det som rapporterats i dessa sidor nyligen. I de senaste månaderna, det har varit tillkännagivanden av teckning av nya företag finansiering, släpp av nya moln-tjänster och drift av ordinarie enterprise cloud business-program. Som inte vill vara kvar av de åtgärder, befintliga leverantörer databas är att lägga till diagram stöd som en del av strategier för att göra sina plattformar mer utbyggbar med multi-modell kapacitet. Och du kan räkna Oracle och Teradata bland dem, i att förlänga deras relationella plattformar med grafen överlägg och Api: er.
Även i kortare historia, Neptunus har ännu inte samlar samma antal referens logotyper som Neo4J, som hade ungefär en 10-års försprång, det är nu nästan ett par dussin framstående referenser som Samsung, NBC Universal, Intuit, FINRA, AstraZeneca och andra. Bland de användningsfall, Thomson Reuters levererar finansiella tjänster analytisk tillämpning på Neptunus som hjälper sina kunder att analysera deras globala skatter och optimera företagets finansiella strukturer i enlighet med detta. Nike Run Club använder Neptunus som nav i medlemsstaternas tillämpning för samman människor och verksamheter som bygger på gemensamma intressen, medan Siemens utvecklat en knowledge graph för att organisera domän kunskap om industriell utrustning.
Vad är nytt med Neptunus?
Många av de funktioner som tas för givet med etablerade företag SQL-databaser, till exempel fråga planeringsverktyg, SYRA transaction support, och kloning, blir checklista objekt för grafdatabaser.
Förra månaden, AWS meddelade utökad sökning, transaktion, och frågan planering tillbehör till Neptunus. Specifikt, den har lagt till en förändring-data-capture (CDC) streaming funktion som gör det möjligt Neptunus ändra loggar för att skapa sina egna strömmar, och detta skulle kunna tänkas foder Kinesis eller Kafka-flöden för analys och uppföljning av ändringar i realtid för att Neptunus grafer. AWS har stärkt transaktion semantik, en funktion som har blivit allt mer viktigt som en graf databaser används för verksamhetskritiska användningsfall. Betydligt, med tanke på de skillnader i sättet att RDF (med SPARQL query language) och egendom (använder Apache TinkerPop Gremlin språk) hanterar frågor, det finns skillnader i sättet att transaktioner som är utsatta för utvecklare i varje motorer.
Andra förbättringar inkluderar nya “Förklara” – funktioner för att ge detaljer om själva frågan utförande planer för SPARQL och Gremlin. En federerad sökning kapacitet för SPARQL över olika Neptunus kluster har också lagts till (men ännu inte för Gremlin). Å andra sidan, Gremlin-motor har nu en session transaktion kapacitet, där frågor strävar endast efter att sessionen har avslutats; det gör att flera uttalanden ske inom en enda transaktion, som är lämplig för kodning komplexa Gremlin transaktioner. Det nyligen har lagt till stöd för databas kloning support är ett exempel på en funktion som förenklar cloud-baserade DevOps och utbyggnader.
Medan Amazon Neptune är en relativt ny grafdatabas deltagare, AWS drag har fått Neo4J och TigerGraph att etablera sina egna managed cloud services. Vårt förslag är att nya data plattformar som grafen är tiggeri för att de förenklingar som managed cloud services kan erbjuda våra kunder ska fokusera på modellering av data snarare än provisioning servrar. Och i själva verket, vi skulle älska att se en del moln-baserade verktyg fram för att hjälpa utvecklare att modellen deras grafer, som dessa tjänster kan leverera. Med tanke på att många av de uppgifter, som IoT, läge, sociala nätverk, och så vidare, som fångas upp av grafer liv utanför data center, som är ännu ett skäl till att den naturliga hem för grafdatabaser bör vara i molnet.
Egendom eller RDF-grafen modell? Vilka modeller har Neptunus användare antogs?
Det finns en bra anledning till populariteten av egendom grafer. Jämfört med RDF, de är mer flexibla, och för många utvecklare, intuitiv förhållande till RDF-modeller. Medan RDF-modeller har en bestämd struktur som bygger på en “trippel” (ämne/titel/objekt), egendom diagram modeller som inte har sådana begränsningar. Det finns en liknande analogi jämföra JSON-baserade dokument-data modeller kontra SQL för relationsdatabaser modeller; JSON kommer att vara mer intuitivt att JavaScript programmerare och enklare för utvecklare i allmänhet utanför SQL gemenskapen, eftersom de är mycket mer förlåtande när det kommer till schemat flexibilitet jämfört med relationsdatabaser.
Men här är där skon klämmer. Medan egendom diagram modeller har blivit de facto-standard för de flesta av dagens generation av grafdatabaser, AWS har funnit att RDF modeller fortsätter att ha en adresserbara marknaden. De lämpar sig väl för väl definierade corpuses av kunskap och, med tanke på dess ursprung för att beskriva funktioner på webben, som rör information från olika källor.
Bara under 18 månader, vilka modeller som har Neptunus användare drogs till? Inte överraskande, de flesta av genomförandet har använt egendom grafer. Men i den övre delen, som omfattar större, mer komplexa datamängder, RDF är valet. Och allt AWS är att se kunder som vill interoperabilitet mellan egendom diagram och RDF. Kanske vad som är gammalt blir som nytt efter alla.
Relaterade Ämnen:
Cloud
Digital Omvandling
Robotteknik
Sakernas Internet
Innovation
Affärssystem
för Stora på Data
| November 26, 2019 — 13:00 GMT (13:00 GMT)
| Ämne: Big Data Analytics