Wreszcie nadchodzi Apache Cassandra 4.0

It took much longer than expected but the queen of NoSQL DBMS’ latest version, Cassandra 4.0, is finally here.

Cóż, to zajęło trochę czasu. Dobrze ponad rok temu Apache Software Foundation ogłosił wersja beta Cassandry 4.0. Deweloperzy bardzo chcieli dostać to w swoje ręce najpopularniejsza z baz danych NoSQL. Niestety, zajęło to więcej czasu, niż wielu miało nadzieję. Następnie o godzinie 11 wykryto paskudny błąd, który further delayed Cassandra’s release przez kilka dni. Ale w końcu Apache Cassandra 4.0 jest już dostępny i gotowy do rozdzierania petabajtów danych.

If you haven’t met this open-source, Baza danych NoSQL it’s high time you did. Like all NoSQL databases, Cassandra’s designed to analyze huge—I opened by saying petabytes remembe—amounts of semi-structured data. The name of Cassandra’s game is storing massive amounts of incoming data with over milion zapisów na sekundę oraz możliwość szybkiego dostępu do tych danych w skalowalny i niezawodny sposób.

Because of that, Cassandra is used as the database of record for some of the world’s most critical applications by companies such as Apple, DataStax, Netflix and Yelp. Because it stores viable data from everything from finance to healthcare and everything in between, its data must have the highest guarantees of correctness and quality. So the Cassandra Project Management Committee decided: “Nadrzędnym celem wersji 4.0 jest to, aby Cassandra 4.0 była w stanie, w którym główni użytkownicy uruchomiliby ją w środowisku produkcyjnym po wycięciu".

Aby tak się stało, załoga Cassandry stworzyła na zamówienie nowe narzędzia do sprawdzania poprawności danych. Obejmowały one: 

  • Testowanie oparte na właściwościach/fuzz
  • Testowanie powtórkowe
  • Testowanie aktualizacji/różnicy
  • Test wydajności
  • Usterka wtrysku
  • Rozszerzenie zasięgu jednostki/testu

This wasn’t easy, and it took more time than expected. The developers also ran into numerous hiccups along the way. But, now they believe the code is fully baked and ready to be served. Indeed, Cassandra 4.0 is already being used in many major businesses. This was, after all, the idea in the first place.

Looking ahead, Cassandra won’t be taking so long with its next release. It may have taken six years to go from Cassandra 3.0 to 4.0, and the 4.0 beta took more than 13 months, but the plan is for Cassandra to move to a six-month release cycle. There will be six months between dot releases, and 12 months between major releases. 

Cassandra 4 wprowadza wiele ulepszeń. Zaczyna się to od obsługi Java 11, długoterminowego wsparcia, oprócz Java 8. Jednak Java Development Kit 11 jest obsługiwany tylko jako funkcja eksperymentalna, więc nie należy go używać w środowisku produkcyjnym.

Cassandra wreszcie uwzględnia również rejestrowanie audytów. Dzięki temu można ustawić konfigurowalne limity pamięci sterty i miejsca na dysku, aby zapobiec błędom braku pamięci. Cała aktywność bazy danych jest rejestrowana dla każdego węzła jako rekordy oparte na plikach w określonym katalogu lokalnego systemu plików. 

W powiązanym rozwoju Cassandra obsługuje teraz pełne rejestrowanie zapytań na żywo. Po raz kolejny możesz ustawić konfigurowalne limity pamięci sterty i miejsca na dysku, aby zapobiec błędom braku pamięci. Oprócz tego, że jest przydatny do przechwytywania ruchu na żywo i odtwarzania ruchu, można go również używać do debugowania ruchu zapytań i migracji.

Cassandra’s new Kopia zerowa streaming, umożliwia aby mieć pięciokrotnie szybsze przesyłanie danych between clusters. For users in the real world, that means five times faster mean time to recovery when there are problems. This, in turn, means it will reduce your total cost of ownership because you’ll need less cloud, server and network resources. 

Finally, Cassandra’s programmers promise that it will be the most stable version of the program ever. I’m inclined to believe them. They take a lot of time and trouble to not just improve Cassandra’s performance but its stability as well. We’ll soon see if my faith in them has been justified. With the kinds of loads Cassandra deals with every day for every one of its customers, there’s no place to hide problems.

