Amazon DocumentDB lägger till globala kluster

0
110

 Tony Baer (dbInsight)

Av Tony Baer (dbInsight) för Big on Data | 2 juni 2021 – 22:36 GMT (23:36 BST) | Ämne: Big Data Analytics

 globular-clusters.gif

Med distribuerad arkitektur som en av fördelarna med NoSQL (eller icke-relaterade) databaser, hanterar Amazon DocumentDB ett nyckelgap med en ny multiregionsfunktion som AWS kallar “Global Clusters.” Hittills stöder DocumentDB, som de flesta AWS-databaser, flera läsreplikat över olika tillgänglighetszoner inom en region. Nu utökar AWS den möjligheten över regioner. Medan det fortfarande finns en enda primär instans för skrivning kommer Global Clusters-funktionen att stödja skrivskyddade sekundära instanser i upp till fem avlägsna regioner.

AWS identifierade två kärnanvändningsfall för den nya Global Clusters-funktionen: katastrof återställning, för att säkerställa att databasen förblir live i händelse av ett regionalt avbrott, och läsningar med låg latens över olika lokala regioner utspridda över hela världen.

För att sammanfatta är databasen, som formellt är märkt Amazon DocumentDB (med MongoDB-kompatibilitet), ett JSON-dokumentdatalager som är MongoDB-kompatibelt. Specifikt använder den sin egen lagringsmotor för automatisk skalning, men överför data till appar via API: er som AWS har skrivit för att vara kompatibla med gränssnitten MongoDB 3.6 och 4.0; den stöder de flesta men inte alla MongoDB API: er. Det finns paralleller med Amazon Aurora, en relationsdatabas med en egen lagringsmotor som har kompatibilitet med MySQL och PostgreSQL, även via API: er.

Global Clusters-funktionen utökar dokumentDB: s befintliga aktiv-passiva replikeringsförmåga, där ändringshändelser replikeras från den primära instansen till skrivskyddade sekundära instanser. Hittills har DocumentDB stött replikering till maximalt 15 repliker över tre tillgänglighetszoner (AZ) inom samma region. Med Global Clusters kan du nu sprida distributionen över upp till fem sekundära regioner (hemregionen förblir den primära), med upp till 16 repliker i varje sekundärregion. Precis som Aurora använder DocumentDB lagringsbaserad replikering för att replikera data över regioner.

Som nämnts ovan har distribuerade databaser ansetts vara normen i NoSQL/icke-relationsvärlden. Till exempel erbjuder Amazon DynamoDB en Global Tables-funktion som distribuerar läser och skriver fullständigt över flera lokala regioner; den förbinder sig att skriva globalt via en “sista författare” tidsstämplad strategi för eventuell konsistens. Sedan introduktionen av DocumentDB har AWS emellertid fokuserat DynamoDB mer som ett nyckel-/värdelager snarare än en dokumentdatabas.

Document DBs arkitektur har en unik fördel när det gäller replikeringsprocesser. Uppgiften hanteras av lagringsvolymen, som avviker från traditionell praxis att köra den från beräkningsnoden. Som ett resultat kommer det inte att finnas någon resurskonflikt mellan resurser som CPU och minne som annars lägger till overhead till applikationer.

I MongoDB-världen har distribuerade funktioner varierat mycket. MongoDB: s egen Atlas-molntjänst började stödja skrivskyddad replikering (som den nya DocumentDB-funktionen) ett år efter att den lanserades. MongoDB själv (lokalt och i molnet) har också en begränsad distribuerad skrivfunktion som anger primärer på skärvnivå, vilket innebär att olika skivor i databasen styr skrivfunktioner för de delar av data som de underhåller. Denna funktion är användbar när datasuveränitetspolicyer kräver att specifika poster endast lagras och/eller uppdateras inom ursprungslandet. Däremot stöder Microsoft Azure Cosmos DB, en multimodell databas som har ett MongoDB-kompatibelt API (som DocumentDB), fullständigt distribuerade läs/skrivfunktioner.

I ett blogginlägg som precis började hävda AWS att uppdateringar från de primära att läsa replikerna körs vanligtvis inom en sekund. DocumentDB Global Clusters är tillgängligt nu.

Big Data

Hadoop's Legacy: Ingen mer rädsla för data Vart ska Snowflake? Weaviate är en öppen källkodssökmotor som drivs av ML, vektorer, grafer och GraphQL Datakunskap: Dags att bota datafobi (TechRepublic)

Relaterade ämnen:

Amazon Digital Transformation Robotics Internet of Things Innovation Enterprise Software < img src = "https://www.zdnet.com/a/hub/i/r/2016/06/23/17c55243-1e48-4fa8-a70f-40f636dab2e3/thumbnail/40x40/3be4eba898743e07a3d4588d104aec5a/tony-baer-aut jpg "class =" "height =" 40 "width =" 40 "alt =" Tony Baer (dbInsight) "height =" 40 "width =" 40 "title =" Amazon DocumentDB lägger till globala kluster "/>

Av Tony Baer (dbInsight) för Big on Data | 2 juni 2021 – 22:36 GMT (23:36 BST) | Ämne: Big Data Analytics