Apache Cassandra 4.0 arrive enfin

Nœud source: 1858876

Cela a pris beaucoup plus de temps que prévu, mais la reine de la dernière version du SGBD NoSQL, Cassandra 4.0, est enfin là.

En savoir plus sur le Big Data

Eh bien, cela a pris du temps. Il y a bien plus d'un an, le Apache Software Foundation a annoncé le bêta de Cassandre 4.0. Les développeurs étaient impatients de mettre la main dessus, le la plus populaire des bases de données NoSQL. Hélas, cela a pris plus de temps que beaucoup ne l'avaient espéré. Puis à la 11e heure, un méchant bug a été trouvé, qui a encore retardé la libération de Cassandra pour quelques jours. Mais enfin Apache Cassandra 4.0 est arrivé et prêt à déchirer vos pétaoctets de données.

VOIR: Politique d'élimination des données électroniques (TechRepublic Premium)

Si vous n'avez pas rencontré cet open-source, Base de données NoSQL il est grand temps que tu le fasses. Comme toutes les bases de données NoSQL, Cassandra est conçue pour analyser d'énormes quantités de données semi-structurées. Le nom du jeu de Cassandra stocke d'énormes quantités de données entrantes avec plus de un million d'écritures par seconde et pouvoir accéder rapidement à ces données de manière évolutive et fiable.

Pour cette raison, Cassandra est utilisée comme base de données d'enregistrement pour certaines des applications les plus critiques au monde par des sociétés telles qu'Apple, DataStax, Netflix et Yelp. Parce qu'il stocke des données viables de tout, de la finance aux soins de santé et tout le reste, ses données doivent avoir les meilleures garanties d'exactitude et de qualité. Ainsi, le comité de gestion du projet Cassandra a décidé : «L'objectif primordial de la version 4.0 est que Cassandra 4.0 soit dans un état où les principaux utilisateurs l'exécuteraient en production lorsqu'elle serait coupée.. »

Pour y parvenir, l'équipe de Cassandra a conçu de nouveaux outils d'exactitude des données sur mesure. Ceux-ci couvraient : 

  • Test basé sur les propriétés/fuzz
  • Test de relecture
  • Test de mise à niveau/diff
  • Test de performance
  • Injection de défaut
  • Extension de la couverture des unités/tests

Cela n'a pas été facile et cela a pris plus de temps que prévu. Les développeurs ont également rencontré de nombreux contretemps en cours de route. Mais, maintenant, ils croient que le code est entièrement cuit et prêt à être servi. En effet, Cassandra 4.0 est déjà utilisé dans de nombreuses grandes entreprises. C'était, après tout, l'idée en premier lieu.

Pour l'avenir, Cassandra ne prendra pas autant de temps avec sa prochaine version. Il a peut-être fallu six ans pour passer de Cassandra 3.0 à 4.0, et la version bêta 4.0 a pris plus de 13 mois, mais il est prévu que Cassandra passe à un cycle de publication de six mois. Il y aura six mois entre les versions par points et 12 mois entre les versions majeures. 

VOIR: Plateforme d'entrepôt de données Snowflake : aide-mémoire (PDF gratuit) (TechRepublic)

Cassandra 4 apporte à la table de nombreuses améliorations. Cela commence par la prise en charge de Java 11, une prise en charge à long terme, en plus de Java 8. Cependant, Java Development Kit 11 n'est pris en charge qu'en tant que fonctionnalité expérimentale, vous ne devez donc pas l'utiliser pour la production.

Cassandra inclut enfin la journalisation d'audit. Avec cela, vous pouvez définir des limites configurables pour la mémoire de tas et l'espace disque pour éviter les erreurs de mémoire insuffisante. Toute l'activité de la base de données est consignée par nœud sous forme d'enregistrements basés sur des fichiers dans un répertoire de système de fichiers local spécifié. 

Dans un développement connexe, Cassandra prend désormais en charge la journalisation complète des requêtes en direct. Une fois de plus, vous pouvez définir des limites configurables pour la mémoire de tas et l'espace disque pour éviter les erreurs de mémoire insuffisante. En plus d'être utile pour la capture et la relecture du trafic en direct, vous pouvez également l'utiliser pour déboguer le trafic de requête et la migration.

Le nouveau de Cassandre Copie zéro streaming, vous permet avoir un flux de données cinq fois plus rapide entre grappes. Pour les utilisateurs du monde réel, cela signifie un temps moyen de récupération cinq fois plus rapide en cas de problème. Cela signifie à son tour que cela réduira votre coût total de possession, car vous aurez besoin de moins de ressources cloud, serveur et réseau. 

Enfin, les programmeurs de Cassandra promettent que ce sera la version la plus stable du programme à ce jour. J'ai tendance à les croire. Ils prennent beaucoup de temps et d'efforts non seulement pour améliorer les performances de Cassandra, mais également pour sa stabilité. Nous verrons bientôt si ma foi en eux a été justifiée. Avec les types de charges que Cassandra traite chaque jour pour chacun de ses clients, il n'y a pas de place pour cacher les problèmes.

Regarde aussi

Source: https://www.techrepublic.com/article/apache-cassandra-4-0-finally-arrives/#ftag=RSS56d97e7

Horodatage:

Plus de Logiciels d'entreprise sur TechRepublic