Apache Cassandra 4.0 finalmente diventa GA

0
157

Tony Baer (dbInsight)

di Tony Baer (dbInsight) per Big on Data | 27 luglio 2021 — 12:00 GMT (13:00 BST) | Argomento: Big Data Analytics

cassandra.jpg

È passato molto tempo – 13 mesi in effetti dall'annuncio della beta – ma Apache Cassandra 4.0 è ora entrato nella versione generale ed è considerato pronto per la produzione. In realtà, il codice è andato in onda ieri pomeriggio, ma oggi è il giorno in cui la comunità di Cassandra sta tirando fuori i fuochi d'artificio.

Ora senti questo: andando avanti, il progetto Apache Cassandra prevede di impegnarsi in cicli di rilascio di 6 mesi. Tieni quel pensiero.

La versione 4.0 è stata posizionata dalla community come una versione abbastanza noiosa, in quanto il peso maggiore dello sforzo è stato quello di bloccare le cose per rendere questa versione punto zero più stabile nella storia di Cassandra. Pre-4.0, le versioni di Cassandra punto zero avrebbero bug che sarebbero stati corretti nelle versioni successive. In questa volta, la comunità ha optato per il banale blocco e contrasto.

Il collega Steven J. Vaughan-Nichols ha fornito informazioni dettagliate su ciò che la versione 4.0 avrebbe incluso lo scorso giugno. Per ricapitolare, il titolo era che questo sarebbe stato “l'Apache Cassandra più stabile della storia”. Tra le nuove funzionalità c'era lo streaming di acquisizione dei dati delle modifiche che viene generalmente utilizzato per la replica, con un throughput fino a 5 volte più veloce per il popolamento di nuovi cluster e fino al 25% per letture e scritture. Inoltre, hanno rafforzato il controllo della coerenza tra le repliche, meglio noto come riparazione incrementale, e hanno aggiunto la registrazione di audit in tempo reale che aiuterà con l'osservabilità.

Mentre la fase beta ha richiesto più di un anno, secondo il vicepresidente delle relazioni con gli sviluppatori di DataStax Patrick McFadden, sono rimasti episodi di nocche bianche fino all'ultimo momento. Anche di recente, la scorsa settimana, si è verificato un bug (successivamente corretto) che ha ritardato il rilascio di otto giorni.

Anche se non fa parte della versione 4.0, la community ha apportato modifiche al processo di sviluppo che, si spera, , rendere il ciclo successivo più gestibile e più rapido. Innanzitutto, il progetto ha ora formalizzato il processo per l'aggiunta di nuove funzionalità, rendendolo più simile a progetti maturi come Spark e Kafka; prima, l'aggiunta di funzionalità era un'attività più ad hoc.

All'ordine del giorno per la versione 4.1 e 5.0 ci sarà come creare più supporto nativo per il cloud in Cassandra. L'operatore Kubernetes sviluppato da DataStax è un ottimo candidato, ma l'implementazione (K8ssandra) rimarrà probabilmente una questione di fornitore. DataStax offrirà l'indice secondario introdotto l'anno scorso. Altri elementi nella lista dei desideri potrebbero includere guardrail che impediscono pratiche come inviare la query dall'inferno o sovraccaricare una tabella con troppi indici.

Ancora più importante, la community di Cassandra sta cambiando il ciclo di rilascio. Il passaggio da Cassandra 3.0 a 4.0 ha richiesto sei anni e, come notato, la versione beta della versione 4.0 si è protratta per 13 mesi. In futuro, il progetto si sta impegnando in cicli di rilascio di 6 mesi, di cui sei mesi sono il rilascio del punto e 12 mesi sono il rilascio principale. È una risposta alle aspettative che, poiché la tua piattaforma viene sempre più utilizzata come servizio cloud, il mercato si aspetta aggiornamenti più frequenti. Quindi, se non c'è nient'altro di entusiasmante nell'elenco delle nuove funzionalità, aggiungere disciplina e velocità al ciclo di sviluppo per Apache Cassandra sarebbe sicuramente adatto.

Divulgazione: DataStax è un client dbInsight.

Big Data

Dov'è il launchpad del cloud ibrido di IBM? Sette modi per rendere la tecnologia in tempo reale reale per la tua organizzazione Machine learning all'avanguardia: TinyML sta diventando grande Quali sono le prospettive di Cloudera? McDonald's vuole “democratizzare” l'apprendimento automatico per tutti gli utenti nelle sue operazioni

Argomenti correlati:

Gestione dei dati Trasformazione digitale Robotica Internet delle cose Innovazione Software aziendale Tony Baer (dbInsight)

Di Tony Baer (dbInsight) per Big on Dati | 27 luglio 2021 — 12:00 GMT (13:00 BST) | Argomento: Analisi dei Big Data