Af Tony Baer (dbInsight) til Big on Data | 2. juni 2021 – 22:36 GMT (23:36 BST) | Emne: Big Data Analytics

Da distribueret arkitektur betragtes som en af fordelene ved NoSQL (eller ikke-relationelle) databaser, adresserer Amazon DocumentDB et nøglehul med en ny multiregionsfunktion, som AWS kalder “Global Clusters.” Indtil nu understøttede DocumentDB, ligesom de fleste AWS-databaser, flere læse-replikaer på tværs af forskellige tilgængelighedszoner inden for en region. Nu udvider AWS denne kapacitet på tværs af regioner. Mens der stadig er en enkelt primær forekomst til skrivning, understøtter Global Clusters-funktionen kun skrivebeskyttede sekundære forekomster i op til fem fjerntliggende regioner.
AWS identificerede to centrale brugssager for den nye Global Clusters-funktion: katastrofe gendannelse, for at sikre, at databasen forbliver live i tilfælde af regionudfald, og lav latens læser over forskellige lokale regioner spredt over hele kloden.
For at opsummere er databasen, der formelt er mærket Amazon DocumentDB (med MongoDB-kompatibilitet), et JSON-dokumentdatalager, der er MongoDB-kompatibelt. Specifikt bruger den sin egen lagringsmotor til automatisk skalering, men overflader data til apps gennem API'er, som AWS har skrevet for at være kompatible med MongoDB 3.6 og 4.0-grænsefladerne; det understøtter de fleste, men ikke alle MongoDB API'er. Der er paralleller med Amazon Aurora, en relationsdatabase med sin egen lagermotor, der har kompatibilitet med MySQL og PostgreSQL, også via API'er.
Global Clusters-funktionen udvider dokumentDB's eksisterende aktive-passive replikeringsfunktion, hvor ændringshændelser replikeres fra den primære forekomst til skrivebeskyttede sekundære forekomster. Indtil nu understøttede DocumentDB replikering til maksimalt 15 replikaer på tværs af tre tilgængelighedszoner (AZ'er) inden for samme region. Med Global Clusters kan du nu sprede implementeringen over op til fem sekundære regioner (hjemregionen forbliver den primære) med op til 16 replikaer i hver sekundærregion. Ligesom Aurora bruger DocumentDB lagerbaseret replikering til at replikere data på tværs af regioner.
Som nævnt ovenfor er distribuerede databaser blevet betragtet som normen i NoSQL/ikke-relationel verden. For eksempel tilbyder Amazon DynamoDB en Global Tables-funktion, der fuldt ud distribuerer læser og skriver på tværs af flere lokale regioner; det forpligter sig til at skrive globalt via en “sidste forfatter” tidsstemplet tilgang til eventuel konsistens. Siden introduktionen af DocumentDB har AWS imidlertid fokuseret DynamoDB mere som en nøgle-/værdilager i stedet for en dokumentdatabase.
Document DB's arkitektur har en unik fordel, når det kommer til replikationsprocesser. Opgaven håndteres af lagervolumen, der afviger fra traditionel praksis med at køre den fra computernoden. Som et resultat vil der ikke være nogen ressourcekonflikt mellem ressourcer såsom CPU og hukommelse, der ellers tilføjer overhead til applikationer.
I MongoDB-verdenen har distribuerede muligheder varieret meget. MongoDBs egen Atlas-skygtjeneste begyndte at understøtte skrivebeskyttet replikering (som den nye DocumentDB-funktion) et år efter lanceringen. MongoDB selv (lokalt og i skyen) har også en begrænset distribueret skrivefunktion, der betegner primær på skårniveau, hvilket betyder, at forskellige udsnit af databasen styrer skrivefunktioner til de dele af de data, de vedligeholder. Denne funktion er nyttig, når datasuverænitetspolitikker kræver, at specifikke poster kun gemmes og/eller opdateres inden for oprindelseslandet. I modsætning hertil understøtter Microsoft Azure Cosmos DB, en multimodel-database, der har en MongoDB-kompatibel API (som DocumentDB), fuldt distribuerede læse-/skrivefunktioner.
I et blogindlæg, der netop blev sat i live, hævder AWS at opdateringer fra de primære at læse repliker udføres typisk inden for et sekund. DocumentDB Global Clusters er tilgængelig nu.
Big Data
Hadoop's Legacy: Ikke mere frygt for data Hvor skal Snowflake hen? Weaviate er en open source-søgemaskine drevet af ML, vektorer, grafer og GraphQL Datakendskab: Tid til at kurere datafobi (TechRepublic)
Relaterede emner:
Amazon Digital Transformation Robotics Internet of Things Innovation Enterprise Software < img src = "https://www.zdnet.com/a/hub/i/r/2016/06/23/17c55243-1e48-4fa8-a70f-40f636dab2e3/thumbnail/40x40/3be4eba898743e07a3d4588d104aec5a/tony-baer-aut jpg "class =" "height =" 40 "width =" 40 "alt =" Tony Baer (dbInsight) "height =" 40 "width =" 40 "title =" Amazon DocumentDB tilføjer globale klynger "/>