Neljä uutta Apache Cassandra 5.0 -ominaisuutta – DATAVERSITY

Neljä uutta Apache Cassandra 5.0 -ominaisuutta – DATAVERSITY

Lähdesolmu: 2522357

Viimeaikaisen kanssa beetaversio Apache Cassandra 5.0:sta, nyt on tiimeille hyvä aika kokeilla ja löytää 5.0:n mielenkiintoisimmat ja odotetuimmat uudet ominaisuudet. 

Uuden beta-version parissa käydessäni tässä on neljä avoimen lähdekoodin Cassandra 5.0:ssa esiteltyä ominaisuutta, joista kehittäjätiimien pitäisi olla innoissaan:

1. Vektorituki: Esittelemme vektorihaun, uusia toimintoja ja uuden vektoritietotyypin

Cassandra 5.0 lisää Vektorihaku, erityisen tehokas uusi ominaisuus relevantin sisällön löytämiseen suurista tietojoukoista, sekä uusia CQL-toimintoja ja uutta vektoritietotyyppiä, joka tallentaa ja noutaa upotusvektoreita. Monille on tärkeää, että nämä uudet ominaisuudet tekevät Cassandra 5.0:sta ihanteellisen tietokerrostekniikan tiimeille, jotka toteuttavat AI/ML-projekteja – tarjoamalla näiden projektien vaatimat erityistoiminnot Cassandran korkean käytettävyyden, skaalautuvuuden ja avoimen lähdekoodin etujen lisäksi. 

ML-malleissa samankaltaisuusvertailujen suorittaminen on kriittistä datan ja datayhteyksien ymmärtämiseksi kontekstissa. Esimerkiksi tekoälysovellukset tuotesuositusmoottoreista generatiivinen tekoäly chatbotit toimivat tunnistamalla malleja ja ekstrapoloimalla päätöksentekoa uusien tietosyötteiden ja kyselyjen samankaltaisuuden perusteella olemassa olevan koulutusdatan kanssa. Kyky tallentaa upotusvektoreita – liukulukulukujen taulukoita, jotka kertovat, kuinka samankaltaisia ​​tietyt objektit tai entiteetit ovat keskenään – on avainasemassa näiden ratkaisevien samankaltaisuusvertailujen mahdollistamiseksi. Siksi Cassandra 5.0 on nyt suosittu ratkaisu tekoälysovellusten kehittämiseen.

2. Tallennukseen liitetty indeksointi

Cassandra 5.0:n uusi Storage-Attached Indexing (SAI) optimoi toissijaisten indeksien elinkaaren ja tekee niistä samalla tehokkaampia varastoja ja helpompia käyttää. SAI:n avulla Cassandra-käyttäjät voivat luoda yhden tai useamman toissijaisen indeksin tietokantataulukkoon jokaisen indeksin perustuessa yhteen käyttäjän valitsemaan sarakkeeseen.

Tämä erittäin skaalautuva, maailmanlaajuisesti hajautettu saraketason indeksointi tarjoaa vertaansa vailla olevan I/O-suorituskyvyn haulle – mukaan lukien vektorihaku. SAI:ssa on myös modulaarinen laajennettavuus, ja Vector Search toimii ensimmäisenä esimerkkinä tästä ominaisuudesta. SAI-indeksit voivat kaapata semantiikan indeksoimalla sekä kyselyt että sisällön (mukaan lukien suuret syötteet, kuten asiakirjat ja kuvat) poikkeuksellisen indeksointitoiminnon saavuttamiseksi.

3. Trie-muistitaulukot ja Trie-indeksoidut SST-taulukot

Cassandra 5.0:n käyttäjät voivat hyödyntää merkittäviä mahdollisia suorituskyvyn parannuksia ja muistin optimointia, jotka tulevat tämän version uusien trie (etuliitepuu) -pohjaisten muistitaulukoiden ja SSTables-tiedostojen mukana. Vaikka Cassandra tunnetaan parhaiten hajautetusta arkkitehtuuristaan, nämä tallennusmuodot käyttävät tietokantaavaimien kokeita ja tavuihin verrattavia esityksiä parantaakseen Cassandran suorituskykyä luku- ja muokkausoperaatioissa sekä tietojen rakenteiden oikeaa mitoitusta varten. Trie Memtables ja Trie-Indexed SSTables vähentävät myös muistinhallinnan yleiskustannuksia ja roskien keräämistä, mikä helpottaa suurten organisaatioiden tietojen hallintaa.

Lopputulos: nämä ominaisuudet, jotka vähentävät tallennustilaa – samalla parantavat skaalautuvuutta sekä kirjoitus- ja lukusuorituskykyä – ansaitsevat Cassandra-käyttäjien huomion ja arvostuksen. 

4. Uudet yhdistämis- ja matemaattiset funktiot

Cassandra 5.0 lisää uusia alkuperäisiä CQL-toimintoja ja käyttäjien mahdollisuuden rakentaa omia uusia käyttäjän määrittämiä toimintoja. Nämä lisäykset lisäävät nopeutta ja joustavuutta, jolla käyttäjät voivat saavuttaa tavoitteensa Cassandralla.

Uusia alkuperäisiä kokoamistoimintoja ovat:

  • count – Selvitä, kuinka monta kohdetta kokoelmassa on
  • max ja min – Etsi kokoelman enimmäis- tai vähimmäismäärä
  • summa ja keskiarvo – Etsi numeerisen kokoelman kohteiden summa tai keskiarvo

Uusia alkuperäisiä toimintoja kokoelmasarakkeiden käyttöä varten ovat:

  • map_keys – Hanki kartan avaimet
  • map_values ​​– Hanki kartan arvot

Uusia alkuperäisiä matemaattisia funktioita ovat:

  • abs – Palauttaa x:n itseisarvon
  • exp – Palauttaa e:n arvon (luonnollisten logaritmien kanta) syötteen potenssiin
  • log – Palauttaa syötteen luonnollisen logaritmin (kanta e).
  • log10 – Palauttaa syötteen 10 kantalogaritmin
  • round – Palauttaa syötettä lähinnä olevan kokonaisluvun

Anna mennä

Niiden, jotka ovat kiinnostuneita hyödyntämään tässä korostetun Cassandra 5.0:n etuja, kannattaa kokeilla sitä itse ja päästä kärkeen täysin avoimen lähdekoodin Cassandran hyödyntämisessä ja optimoinnissa.

Aikaleima:

Lisää aiheesta DATAVERSITEETTI