Apache Cassandra 4.0 går endelig til GA

0
86

 Tony Baer (dbInsight)

Af Tony Baer (dbInsight) til Big on Data | 27. juli 2021 – 12:00 GMT (13:00 BST) | Emne: Big Data Analytics

 cassandra.jpg

Det har længe været – faktisk 13 måneder siden betaversionen blev annonceret – men Apache Cassandra 4.0 er nu kommet i generel udgivelse og betragtes som produktionsklar. Faktisk blev koden live i går eftermiddag, men i dag er dagen, hvor Cassandra-samfundet trækker fyrværkeriet ud.

Nu får du det – fremadrettet planlægger Apache Cassandra-projektet at forpligte sig til 6 måneders frigivelsescyklusser. Hold den tanke.

4.0-udgivelsen blev positioneret af samfundet som en temmelig kedelig udgivelse – idet indsatsen var at låse tingene ned for at gøre dette til den mest stabile dot zero-frigivelse i Cassandra-historien. Pre-4.0, dot zero Cassandra-udgivelser ville have bugs, der ville have likvideret med at blive patched i efterfølgende dot releases. På denne gang valgte samfundet den verdslige blokering og tackling.

Kollega Steven J. Vaughan-Nichols gav nedturen på, hvad 4.0-udgivelsen ville omfatte tilbage i juni sidste år. For at resumere var overskriften, at dette ville være “den mest stabile Apache Cassandra i historien.” Blandt de nye funktioner var ændring af datafangststreaming, som typisk bruges til replikering, med gennemstrømning op til 5 gange hurtigere til udfyldning af nye klynger og op til 25% til læsning og skrivning. Derudover har de hærdet konsistenskontrol mellem replikaer, bedre kendt som inkrementel reparation, og har tilføjet auditlogning i realtid, der vil hjælpe med observerbarhed.

Mens beta-scenen tog over et år, ifølge DataStax vicepræsident for udviklerforhold Patrick McFadden, forblev der hvide knogepisoder indtil sidste øjeblik. Selv så sent som i sidste uge var der en fejl (efterfølgende patched), der forsinkede frigivelsen med otte dage.

Selvom den ikke var en del af 4.0-udgivelsen, foretog samfundet ændringer i udviklingsprocessen, der forhåbentlig vil , gør den næste cyklus mere håndterbar og hurtigere. For det første har projektet nu formaliseret processen med at tilføje nye funktioner, hvilket gør det mere som modne projekter som Spark og Kafka; før var tilføjelse af funktioner en mere ad hoc-aktivitet.

På dagsordenen for 4.1 og 5.0 vil det være, hvordan man bygger mere cloud-native support i Cassandra. Kubernetes-operatøren, som DataStax udviklede, er en hovedkandidat, men implementeringen (K8ssandra) vil sandsynligvis forblive en leverandørsag. DataStax vil tilbyde det sekundære indeks, som det introducerede sidste år. Andre ting på ønskelisten kan omfatte beskyttelseslister, der forhindrer fremgangsmåder som at sende forespørgslen fra helvede eller overbelaste en tabel med for mange indekser.

Endnu vigtigere er, at Cassandra-samfundet ændrer frigivelsescyklussen. At gå fra Cassandra 3.0 til 4.0 tog seks år, og som nævnt strakte betaen til 4.0-udgivelsen sig over 13 måneder. Fremover forpligter projektet sig til 6-måneders frigivelsescyklusser, hvor seks måneder er punktudgivelsen og 12 måneder den største frigivelse. Det er et svar på forventningerne om, at da din platform i stigende grad forbruges som en skytjeneste, forventer markedet hyppigere opdateringer. Så hvis der ikke er noget andet spændende på listen over nye funktioner, ville tilføjelse af disciplin og hastighed til udviklingscyklussen for Apache Cassandra helt sikkert passe regningen.

Oplysning: DataStax er en dbInsight-klient.

Big Data

Hvor er IBMs hybrid cloud launchpad? Syv måder at gøre realtidsteknologi til virkelighed for din organisation Maskinindlæring på kanten: TinyML bliver stor Hvad er næste for Cloudera? McDonald's ønsker at 'demokratisere' maskinindlæring for alle brugere på tværs af sine operationer

Relaterede emner:

Data Management Digital Transformation Robotics Internet of Things Innovation Enterprise Software  Tony Baer (dbInsight)

Af Tony Baer (dbInsight) til Big on Data | 27. juli 2021 – 12:00 GMT (13:00 BST) | Emne: Big Data Analytics