Apache Cassandra 4.0 wird endlich GA

0
170

Tony Baer (dbInsight)

Von Tony Baer (dbInsight) für Big on Data | 27. Juli 2021 — 12:00 GMT (13:00 BST) | Thema: Big Data Analytics

cassandra.jpg

Es hat lange gedauert – 13 Monate seit der Ankündigung der Beta –, aber Apache Cassandra 4.0 ist jetzt in die allgemeine Veröffentlichung eingetreten und gilt als produktionsbereit. Eigentlich ging der Code gestern Nachmittag live, aber heute ist der Tag, an dem die Cassandra-Gemeinde das Feuerwerk herausholt.

Jetzt verstehen Sie das: Das Apache Cassandra-Projekt plant, sich in Zukunft auf sechsmonatige Release-Zyklen festzulegen. Halte diesen Gedanken fest.

Das 4.0-Release wurde von der Community als ziemlich langweiliges Release positioniert – insofern die Hauptarbeit darin bestand, die Dinge zu verriegeln, um es zum stabilsten Dot-Zero-Release in der Geschichte von Cassandra zu machen. Vor 4.0, Punkt-Null-Casandra-Versionen hatten Fehler, die in nachfolgenden Punkt-Versionen gepatcht worden wären. Dieses Mal entschied sich die Community für das banale Blocken und Anpacken.

Kollege Steven J. Vaughan-Nichols gab im Juni letzten Jahres einen Überblick über die 4.0-Veröffentlichung. Zusammenfassend lautete die Überschrift, dass dies “der stabilste Apache Cassandra in der Geschichte” sein würde. Zu den neuen Funktionen gehörte das Änderungsdatenerfassungs-Streaming, das normalerweise für die Replikation verwendet wird, mit einem bis zu 5-mal schnelleren Durchsatz für das Auffüllen neuer Cluster und bis zu 25 % für Lese- und Schreibvorgänge. Darüber hinaus haben sie die Konsistenzprüfung zwischen Replikaten, besser bekannt als inkrementelle Reparatur, verbessert und eine Echtzeit-Audit-Protokollierung hinzugefügt, die die Beobachtbarkeit verbessert.

Während die Betaphase über ein Jahr dauerte, blieben laut Patrick McFadden, Vice President of Developer Relations von DataStax, bis zum letzten Moment White-Knuckle-Episoden. Noch in der letzten Woche gab es einen Fehler (nachträglich gepatcht), der die Veröffentlichung um acht Tage verzögerte.

Obwohl es nicht Teil der Version 4.0 war, hat die Community Änderungen am Entwicklungsprozess vorgenommen, die hoffentlich will , machen den nächsten Zyklus einfacher und schneller. Erstens hat das Projekt jetzt den Prozess zum Hinzufügen neuer Funktionen formalisiert, sodass es eher wie ausgereifte Projekte wie Spark und Kafka funktioniert; früher war das Hinzufügen von Funktionen eher eine Ad-hoc-Aktivität.

Auf der Agenda für 4.1 und 5.0 steht, wie Cassandra mehr Cloud-native Unterstützung integriert. Der von DataStax entwickelte Kubernetes-Betreiber ist ein erstklassiger Kandidat, aber die Implementierung (K8ssandra) wird wahrscheinlich eine Anbieterangelegenheit bleiben. DataStax wird den im letzten Jahr eingeführten Sekundärindex anbieten. Andere Punkte auf der Wunschliste könnten Leitplanken sein, die Praktiken wie das Absenden der Abfrage aus der Hölle oder das Überladen einer Tabelle mit zu vielen Indizes verhindern.

Noch wichtiger ist, dass die Cassandra-Community den Veröffentlichungszyklus ändert. Der Übergang von Cassandra 3.0 zu 4.0 dauerte sechs Jahre, und wie bereits erwähnt, erstreckte sich die Beta für die 4.0-Version über 13 Monate. Für die Zukunft verpflichtet sich das Projekt zu 6-monatigen Release-Zyklen, wobei sechs Monate das Dot-Release und 12 Monate das Major-Release sind. Es ist eine Reaktion auf die Erwartungen, dass der Markt häufigere Updates erwartet, da Ihre Plattform zunehmend als Cloud-Dienst genutzt wird. Wenn es also nichts anderes Aufregendes auf der Liste der neuen Funktionen gibt, würde es sicherlich passen, den Entwicklungszyklus für Apache Cassandra um Disziplin und Geschwindigkeit zu erweitern.

Offenlegung: DataStax ist ein dbInsight-Client.

Big Data

Wo ist das Hybrid Cloud Launchpad von IBM? Sieben Möglichkeiten, Echtzeit-Technologie für Ihr Unternehmen real zu machen Machine Learning am Edge: TinyML wird groß Was kommt als nächstes für Cloudera? McDonald's möchte maschinelles Lernen für alle Benutzer im gesamten Betrieb “demokratisieren”

Verwandte Themen:

Datenmanagement Digitale Transformation Robotik Internet der Dinge Innovation Unternehmenssoftware Tony Baer (dbInsight)

Von Tony Baer (dbInsight) für Big on Daten | 27. Juli 2021 — 12:00 GMT (13:00 BST) | Thema: Big-Data-Analyse