Indhente med Amazon Neptun

0
170

Tony Baer (dbInsight)

Af Tony Baer (dbInsight)

for at Kæmpe om Data

| November 26, 2019 — 13:00 GMT (13:00 GMT)

| Emne: Big Data Analytics

graph-database.png

Med re:Opfinde på tryk i næste uge, vil Internettet være sprængfyldt med AWS-meddelelser. Med en række af meddelelser i sidste måned, Neptun, Amazon ‘ s graf-database, vil ikke hog søgelyset i næste uge. Men det er næppe, fordi platformen har stået stille.

Med Neptun i produktion i næsten et år og en halv, vi var interesseret i at se, hvad slags tager op, det har haft, især i betragtning af den kendsgerning, at det er sjældent eksempel på en graf data platform, der understøtter både de ældre Ressource Description Framework (RDF) model, der kom ud af det semantiske web, og de nyere ejendom graf model, der er opfundet af Neo4J, der er blevet den standard standard i de fleste nye graph database poster.

Der er en god grund til, at AWS trængt ind på dette marked.

Big Data bro George Anadiotis har boet grafen drøm, og dokumenteret sit liv af grafen i et dybt dyk rapport, som han har offentliggjort for over et år siden. Mens vi vil ikke gå så langt som George i at sige, at vi er i “året for den graf,” vi vil sige, at hvor der er røg, er der ild, og der har været masser af, at de indberettede på disse sider for nylig. I de sidste par måneder alene, der har været meddelelser om tegning af nye venture finansiering; udgivelse af nye cloud-tjenester, og det tænder af mainstream enterprise cloud business-applikationer. Som ikke ønsker at stå ud af den handling, eksisterende database leverandører er ved at tilføje grafen støtte som en del af strategier for at gøre deres platforme mere extensible med multi-model kapacitet. Og du kan regne Oracle og Teradata blandt dem, i forlængelse af deres relationelle platforme med graf overlays og Api ‘ er.

Selvom der i sin kortere historie, Neptun har endnu til at samle samme antal reference logoer som Neo4J, som var omkring en 10-års forspring, er der nu næsten et par dusin fremtrædende referencer såsom Samsung, NBC Universal, Intuit, FINRA, AstraZeneca og andre. Blandt de use cases, Thomson Reuters leverer en finansiel tjenesteydelse analytiske anvendelse på Neptun, der hjælper sine kunder med at analysere deres globale skattemæssige forpligtelser og optimere deres virksomhedernes finansielle strukturer i overensstemmelse hermed. Nike Run Club bruger Neptun som hub af det pågældende program til at forbinde mennesker og aktiviteter er baseret på fælles interesser, mens Siemens har udviklet en viden grafen for organisering af domæne viden om industrielle udstyr.

Hvad er nyt med Neptun?

Mange af de funktioner, der tages for givet med de etablerede enterprise SQL-databaser, såsom forespørgsel planlægning værktøjer, SYRE transaktion støtte, og kloning, bliver tjekliste elementer til graf databaser.

Sidste måned, AWS annonceret forlænget forespørgsel, transaktion, og forespørgsel planlægning af forbedringer til Neptun. Specielt, det har tilføjet en ændring-data-opsamling (CDC) streaming kapacitet, der giver mulighed Neptun ændre logfiler til at skabe deres egne vandløb; dette kunne tænkes at fodre Kinesis eller Kafka-feeds for at google analytics og overvågning i real-time ændringer til Neptun grafer. AWS har styrket transaktion semantik, en funktion, der er blevet stadig vigtigere som graf databaser bliver brugt til forretningskritiske use cases. Væsentligt, henset til de forskelle i den måde, at RDF (med SPARQL query language) og ejendom (ved brug af Apache TinkerPop Gremlin sprog) håndtere forespørgsler, der er forskelle i den måde, at transaktioner, der er udsat for udviklere i hver af de motorer.

Andre forbedringer omfatter nye “Forklare” funktioner, som giver detaljer om den faktiske forespørgsel udførelse planer for SPARQL-og Gremlin. En forenet forespørgsel evne til SPARQL på tværs af forskellige Neptun klynger er også blevet tilføjet (men endnu ikke for Gremlin). På den anden side, Gremlin motoren har nu en session transaktion evne, hvor forespørgsler, der er begået efter sessionen er lukket; der tillader flere sætninger til at ske inden for en enkelt transaktion, som er egnet til kodning komplekse Gremlin transaktioner. Det har for nylig tilføjet understøttelse af database kloning støtte er et eksempel på en funktion som forenkler cloud-baseret DevOps og installationer.

Mens Amazon Neptune er en forholdsvis ny graf-database udbyder, AWS ‘ s bevægelse har bedt om Neo4J og TigerGraph at indvarsle i deres egen managed cloud-tjenester. Vores tag er, at nye data platforme som graf er tigger om en forenkling, at cloud managed service kan give – kunder bør fokusere på modellering af data snarere end provisioning servere. Og faktisk, vi ville elske at se nogle af de cloud-baserede værktøjer dukke op, der hjælper udviklere model deres grafer, som disse tjenester kan levere. I betragtning af, at mange af de data, som IoT, beliggenhed, sociale netværk, og så videre, der er ved at blive fanget af grafer liv uden data center, der endnu mere grund til, at den naturlige hjem til graf databaser bør være i skyen.

Ejendom eller RDF graf model? Hvilke modeller har Neptun brugere vedtaget?

Der er en god grund til populariteten af ejendom grafer. I forhold til RDF, de er mere fleksible, og for mange udviklere, intuitiv i forhold til RDF modeller. Mens RDF modeller har en fastsat struktur, der er baseret på “tripler” (subjekt/prædikat/objekt), ejendom graf modeller mangler sådanne begrænsninger. Der er en lignende analogi at sammenligne JSON-baseret dokument data modeller vs. SQL relationelle modeller; JSON vil være mere intuitivt at JavaScript programmører og lettere for udviklere generelt uden SQL-fællesskabet, fordi de er langt mere tilgivende, når det kommer til skema fleksibilitet i forhold til relationelle.

Men her er det springende punkt. Mens ejendom graf modeller er blevet de facto standard for de fleste af den nuværende generation af grafen databaser, AWS har fundet, at RDF modeller fortsat at have en adresserbare marked. De er velegnede til veldefinerede corpuses af viden, og i betragtning af dens oprindelse til at beskrive funktioner, på nettet, i relation til oplysninger fra forskellige kilder.

Lige under 18 måneder på, hvilke modeller der har Neptun brugere draget til? Ikke overraskende, de fleste af gennemførelsen har anvendt ejendommen grafer. Men i den høje ende, der involverer større, mere komplekse datasæt, RDF stadig valget. Og i stigende grad AWS er at se kunder, der ønsker interoperabilitet mellem ejendom graf og RDF. Måske, hvad der er gammelt er ny, efter at alle.

Relaterede Emner:

Cloud

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software

Tony Baer (dbInsight)

Af Tony Baer (dbInsight)

for at Kæmpe om Data

| November 26, 2019 — 13:00 GMT (13:00 GMT)

| Emne: Big Data Analytics