Apache Cassandra 4.0 går endelig til GA

0
166

 Tony Baer (dbInsight)

Av Tony Baer (dbInsight) for Big on Data | 27. juli 2021 – 12:00 GMT (13:00 BST) | Emne: Big Data Analytics

 cassandra.jpg

Det har gått lang tid – faktisk 13 måneder siden beta ble kunngjort – men Apache Cassandra 4.0 har nå kommet i generell utgivelse og regnes som produksjonsklar. Egentlig gikk koden live i går ettermiddag, men i dag er dagen da Cassandra-samfunnet henter ut fyrverkeriet.

Nå får du dette – fremover planlegger Apache Cassandra-prosjektet å forplikte seg til seks måneders utgivelsessykluser. Hold den tanken.

4.0-utgivelsen ble posisjonert av samfunnet som en ganske kjedelig utgivelse – ved at innsatsen var å låse ting for å gjøre dette til den mest stabile dot zero-utgivelsen i Cassandra-historien. Pre-4.0, dot zero Cassandra-utgivelser ville ha feil som ville ha blitt avviklet i lapp i påfølgende dot-utgivelser. På denne tiden valgte samfunnet den verdslige blokkeringen og taklingen.

Kollega Steven J. Vaughan-Nichols ga nedtrappingen på hva 4.0-utgivelsen ville inkludere tilbake i juni i fjor. For å oppsummere var overskriften at dette ville være “den mest stabile Apache Cassandra i historien.” Blant de nye funksjonene var datastreaming av endringsdata som vanligvis brukes til replikering, med gjennomstrømning opptil 5 ganger raskere for å fylle ut nye klynger og opptil 25% for lesing og skriving. I tillegg har de herdet konsistenskontroll mellom replikaer, bedre kjent som trinnvis reparasjon, og har lagt til sanntids revisjonslogging som vil hjelpe med observerbarhet.

Mens beta-scenen tok over et år, ifølge DataStax visepresident for utviklerforhold Patrick McFadden, forble det hvite knokeepisoder frem til siste øyeblikk. Selv så sent som i forrige uke var det en feil (senere lappet) som forsinket utgivelsen med åtte dager.

Selv om den ikke var en del av 4.0-utgivelsen, gjorde samfunnet endringer i utviklingsprosessen som forhåpentligvis vil , gjør neste syklus mer håndterbar og raskere. For det første har prosjektet nå formalisert prosessen for å legge til nye funksjoner, slik at det fungerer mer som modne prosjekter som Spark og Kafka; før var det å legge til funksjoner en mer ad hoc-aktivitet.

På agendaen for 4.1 og 5.0 vil være hvordan du bygger mer skyinnfødt støtte til Cassandra. Kubernetes-operatøren som DataStax utviklet er en hovedkandidat, men implementeringen (K8ssandra) vil sannsynligvis forbli en leverandørsak. DataStax vil tilby den sekundære indeksen den introduserte i fjor. Andre ting på ønskelisten kan omfatte rekkverk som forhindrer fremgangsmåter som å sende spørsmålet fra helvete eller overbelaste et bord med for mange indekser.

Enda viktigere er at Cassandra-samfunnet endrer utgivelsessyklusen. Å gå fra Cassandra 3.0 til 4.0 tok seks år, og som nevnt, strekker betaen for 4.0-utgivelsen seg over 13 måneder. Fremover forplikter prosjektet seg til seks måneders utgivelsessykluser, med seks måneder som punktutgivelse og 12 måneder som den største utgivelsen. Det er et svar på forventningene om at siden plattformen din i økende grad blir brukt som en skytjeneste, forventer markedet hyppigere oppdateringer. Så hvis det ikke er noe annet spennende på den nye funksjonslisten, vil tilføyelse av disiplin og hastighet til utviklingssyklusen for Apache Cassandra absolutt passe regningen.

Disclosure: DataStax er en dbInsight-klient.

Big Data

Hvor er IBMs hybridsky launchpad? Syv måter å gjøre sanntidsteknologi virkelig for organisasjonen din Maskinlæring på kanten: TinyML blir stor Hva er neste for Cloudera? McDonald's ønsker å 'demokratisere' maskinlæring for alle brukere på tvers av virksomheten.

Relaterte emner:

Data Management Digital Transformation Robotics Internet of Things Innovasjon Enterprise Software  Tony Baer (dbInsight)

Av Tony Baer (dbInsight) for Big on Data | 27. juli 2021 – 12:00 GMT (13:00 BST) | Tema: Big Data Analytics