Aprendo la strada Yellowbrick verso una più stretta integrazione con gli archivi dati cloud

Nodo di origine: 808188

Unisciti a Transform 2021 dal 12 al 16 luglio. Registrati perr l'evento AI dell'anno.


Tradizionalmente, i data warehouse significavano che le aziende dovevano impegnarsi su un'unica piattaforma o subire la complessità di gestire più infrastrutture quasi compatibili. Con quello in mente, Dati di mattoni gialli ha recentemente lanciato Yellowbrick Manager per semplificare agli amministratori la gestione dei data warehouse su cloud distribuiti e implementazioni locali con un'interfaccia semplificata.

Gli utenti possono controllare i data warehouse Yellowbrick nei cloud pubblici, sulle istanze hardware Yellowbrick, in nuvole private, e anche ai margini della rete, ha affermato la società. Yellowbrick Manager fornisce un sistema di controllo unificato che utilizza il sistema di orchestrazione dei contenitori Kubernetes per consentire agli utenti di gestire e controllare sia le distribuzioni cloud che quelle locali con funzionalità di prestazioni migliorate.

"È questo unico piano di controllo unificato, insieme all'adozione di Kubernetes nel nostro software di database, che ci distingue", ha dichiarato a VentureBeat il CTO di Yellowbrick Mark Cusack.

L'azienda ha inoltre aggiunto funzionalità agili di spostamento dei dati per aiutare i clienti a integrare Yellowbrick con data lake basati su archivi di oggetti cloud come Amazon S3. Un'anteprima della tecnologia è prevista all'inizio di maggio e la disponibilità generale è fissata per la seconda metà del 2021. Sempre all'inizio di maggio, sarà disponibile un aggiornamento alla versione 5 del data warehouse di Yellowbrick, con miglioramenti all'integrazione del data Lake che includono il supporto nativo per gli oggetti cloud. storage (inclusi Amazon S3 e Azure Data Lake Storage Gen 2).

Lavorare tra le nuvole

Una delle critiche rivolte ai cloud ibridi riguarda l’insieme disgiunto di tecnologie ed esperienze utente nei cloud privati ​​e pubblici. Esistono diversi approcci alla gestione delle identità e degli accessi, il che rende più difficile governare accesso ai dati in questi ambientie in genere vengono forniti in modo diverso. Yellowbrick si posiziona come il primo data warehouse per il cloud distribuito introducendo un piano di controllo unificato che funziona sulle piattaforme cloud più comuni. Questo piano di controllo aumenta la semplicità di esecuzione di più data warehouse in diverse sedi fisiche e line-of-business all'interno di un'azienda.

L'architettura nativa del cloud Kubernetes fornisce a Yellowbrick Manager un unico pannello di controllo unificato per fornire nuove istanze di data warehouse in cloud diversi, gestire l'infrastruttura esistente e monitorare le distribuzioni.

Yellowbrick ha affermato che le query del data warehouse di Yellowbrick vengono eseguite 3 volte più velocemente sulle istanze ottimizzate per Andromeda per cloud privati ​​rispetto all'architettura di prima generazione dell'azienda. I miglioramenti delle prestazioni sono anche il risultato del passaggio dell'azienda alle nuove CPU AMD a 64 core, dell'aumento della larghezza di banda tra le note del server e dell'aggiunta di due schede acceleratrici di scansione Kalidah proprietarie che scaricano carichi di lavoro come filtraggio, compressione/decompressione e trasposizione di righe/colonne da CPU.

"L'istanza di Andromeda è la piattaforma più veloce su cui eseguire Yellowbrick", ha affermato Cusack.

L'azienda sta ottimizzando le implementazioni per sfruttare le differenze tra i grandi fornitori di servizi cloud. Ad esempio, se un'istanza del cloud pubblico dispone di storage ad alte prestazioni, Yellowbrick può adattarsi all'hardware sottostante per sfruttare tali vantaggi.

L'approccio di Yellowbrick

Yellowbrick si sta concentrando sul miglioramento degli aspetti di gestione dei cloud distribuiti piuttosto che unirli direttamente.

I concorrenti tendono a rientrare in due categorie principali: data warehouse legacy come Teradata, Oracle e SQL Server o data warehouse solo cloud come Snowflake, Amazon Redshift e Microsoft Azure Synapse. Yellowbrick cerca di differenziarsi adottando un approccio unificato per affrontare le sfide dei dati distribuiti come la gravità dei dati e i requisiti di sovranità. È stato progettato da zero per ottimizzare il rapporto prezzo/prestazioni su infrastrutture bare metal e virtualizzate nei cloud pubblici.

Il vicepresidente del marketing dei prodotti Yellowbrick, Justin Kestelyn, afferma che Yellowbrick ha un vantaggio rispetto ai fornitori legacy che hanno raddoppiato le loro architetture più vecchie e hanno difficoltà con l'analisi in tempo reale. I fornitori di cloud tradizionali non hanno perseguito in modo aggressivo opzioni ibride per l’analisi all’edge.

"Stiamo ottenendo affari da tutti questi fornitori fornendo il miglior rapporto prezzo/prestazioni e il minor rischio di implementazione", ha affermato Cusack.

VentureBeat

La missione di VentureBeat è quella di essere una piazza cittadina digitale per i responsabili delle decisioni tecniche per acquisire conoscenze sulla tecnologia trasformativa e sulle transazioni. Il nostro sito fornisce informazioni essenziali sulle tecnologie e strategie dei dati per guidarti mentre guidi le tue organizzazioni. Ti invitiamo a diventare un membro della nostra community, per accedere a:

  • informazioni aggiornate sugli argomenti di tuo interesse
  • le nostre newsletter
  • contenuti gated leader di pensiero e accesso scontato ai nostri eventi pregiati, come Trasforma NO: Per saperne di più
  • funzionalità di rete e altro ancora

Diventa member

Fonte: https://venturebeat.com/2021/04/14/paving-the-whitebrick-road-to-closer-integration-with-cloud-data-stores/

Timestamp:

Di più da VentureBeat