Recentemente abbiamo annunciato la disponibilità generale di Amazon OpenSearch senza server , una nuova opzione per Servizio Amazon OpenSearch ciò semplifica l'esecuzione di carichi di lavoro di ricerca e analisi su larga scala senza dover configurare, gestire o ridimensionare i cluster OpenSearch. Con OpenSearch Serverless, ottieni gli stessi tempi di risposta interattivi in millisecondi di OpenSearch Service con la semplicità di un ambiente serverless.
In questo post imparerai come migrare i tuoi indici esistenti da un dominio cluster gestito da OpenSearch Service a una raccolta serverless utilizzando Logstash.
Con i domini OpenSearch, ottieni cluster dedicati e sicuri configurati e ottimizzati per i tuoi carichi di lavoro in pochi minuti. Hai il controllo completo sulla configurazione delle risorse di elaborazione, memoria e storage nei cluster per ottimizzare i costi e le prestazioni delle tue applicazioni. OpenSearch Serverless offre un modo ancora più semplice per eseguire i carichi di lavoro di ricerca e analisi, senza dover mai pensare ai cluster. È sufficiente creare una raccolta e un gruppo di indici e iniziare a importare e interrogare i dati.
Panoramica della soluzione
Logstash è un software open source che fornisce ETL (estrazione, trasformazione e caricamento) per i tuoi dati. Puoi configurare Logstash per connettersi a un'origine e una destinazione tramite plug-in di input e output. Nel mezzo, configuri i filtri che possono trasformare i tuoi dati. Questo post ti guida attraverso i passaggi necessari per configurare Logstash per connettere un dominio del servizio OpenSearch (input) a una raccolta OpenSearch Serverless (output).
Imposta i plug-in di origine e destinazione nel file di configurazione di Logstash. Il file di configurazione ha sezioni per Input
, Filter
e Output
. Una volta configurato, Logstash invierà una richiesta al dominio del servizio OpenSearch e leggerà i dati in base alla query inserita nel input
sezione. Dopo che i dati sono stati letti da OpenSearch Service, puoi facoltativamente inviarli alla fase successiva Filter
per trasformazioni come l'aggiunta o la rimozione di un campo dai dati di input o l'aggiornamento di un campo con valori diversi. In questo esempio, non utilizzerai il Filter
collegare. Il prossimo è il Output
collegare. La versione open source di Logstash (Logstash OSS) fornisce un modo conveniente per utilizzare l'API in blocco per caricare i dati nelle raccolte. OpenSearch Serverless supporta il logstash-output-opensearch plug-in di output, che supporta Gestione dell'identità e dell'accesso di AWS Credenziali (IAM) per il controllo dell'accesso ai dati.
Il diagramma seguente illustra il flusso di lavoro della nostra soluzione.
Prerequisiti
Prima di iniziare, assicurati di aver completato i seguenti prerequisiti:
- Annota l'ARN, il nome utente e la password del tuo dominio OpenSearch Service.
- Crea una raccolta OpenSearch Serverless. Se non conosci OpenSearch Serverless, fai riferimento a Log analytics nel modo più semplice con Amazon OpenSearch Serverless per i dettagli su come impostare la tua raccolta.
Configura Logstash e i plug-in di input e output per OpenSearch
Completa i seguenti passaggi per configurare Logstash e i tuoi plug-in:
- Scaricare
logstash-oss-with-opensearch-output-plugin
. (Questo esempio utilizza la distro per macos-x64. Per altre distro, fare riferimento al file artefatti.) - Estrai il tarball scaricato:
- Aggiorna il
logstash-output-opensearch
plug-in all'ultima versione: - installare il
logstash-input-opensearch
collegare:
Prova il plug-in
Entriamo in azione e vediamo come funziona il plugin. Il seguente file di configurazione recupera i dati dal file movies
indicizza nel tuo dominio OpenSearch Service e indicizza i dati nella tua raccolta OpenSearch Serverless con lo stesso nome di indice, movies
.
Crea un nuovo file e aggiungi il seguente contenuto, quindi salva il file con nome opensearch-serverless-migration.conf
. Fornisci i valori per l'endpoint di dominio del servizio OpenSearch in HOST, USERNAMEe PASSWORD nel input
sezione e i dettagli dell'endpoint di raccolta OpenSearch Serverless in HOST con REGIONE, AWS_ACCESS_KEY_IDe AWS_SECRET_ACCESS_KEY nel output
.
È possibile specificare una query nel file input
sezione della configurazione precedente. IL match_all
query corrisponde a tutti i dati nel file movies
indice. È possibile modificare la query se si desidera selezionare un sottoinsieme dei dati. Puoi anche utilizzare la query per parallelizzare il trasferimento dei dati eseguendo più processi Logstash con configurazioni che specificano sezioni di dati diverse. Puoi anche eseguire la parallelizzazione eseguendo i processi Logstash su più indici, se li hai.
Avvia Logstash
Utilizzare il seguente comando per avviare Logstash:
Dopo aver eseguito il comando, Logstash recupererà i dati dall'indice di origine dal tuo dominio del servizio OpenSearch e scriverà nell'indice di destinazione nella tua raccolta OpenSearch Serverless. Quando il trasferimento dei dati è completo, Logstash si spegne. Vedere il seguente codice:
Verifica i dati in OpenSearch Serverless
Puoi verificare che Logstash abbia copiato tutti i tuoi dati confrontando il conteggio dei documenti nel tuo dominio e la tua raccolta. Eseguire la query seguente dal file Strumenti di sviluppo scheda o con curl
, postman
o un client HTTP simile. La seguente query ti aiuta a cercare tutti i documenti dal file movies
index e restituisce i primi documenti insieme al conteggio. Per impostazione predefinita, OpenSearch restituirà il conteggio dei documenti fino a un massimo di 10,000. Aggiungendo il track_total_hits
flag ti aiuta a ottenere il conteggio esatto dei documenti se il conteggio dei documenti supera i 10,000.
Conclusione
In questo post, hai eseguito la migrazione dei dati dal tuo dominio OpenSearch Service alla tua raccolta OpenSearch Serverless utilizzando i plug-in di input e output OpenSearch di Logstash.
Resta sintonizzato per una serie di post incentrati sulle varie opzioni disponibili per creare analisi dei log efficaci e soluzioni di ricerca utilizzando OpenSearch Serverless. Puoi anche fare riferimento a Nozioni di base su Amazon OpenSearch Serverless workshop per saperne di più su OpenSearch Serverless.
Se hai un feedback su questo post, invialo nella sezione commenti. Se hai domande su questo post, apri una nuova discussione sul Forum del servizio Amazon OpenSearch or contatta il supporto AWS.
Circa gli autori
Prashant Agrawal è Senior Search Specialist Solutions Architect con Amazon OpenSearch Service. Lavora a stretto contatto con i clienti per aiutarli a migrare i loro carichi di lavoro nel cloud e aiuta i clienti esistenti a mettere a punto i loro cluster per ottenere prestazioni migliori e risparmiare sui costi. Prima di entrare in AWS, ha aiutato vari clienti a utilizzare OpenSearch ed Elasticsearch per i loro casi d'uso di ricerca e analisi dei log. Quando non lavora, puoi trovarlo in viaggio ed esplorare nuovi posti. Insomma, gli piace fare Mangia → Viaggia → Ripeti.
Jon Handler (@_searchgeek) è Sr. Principal Solutions Architect presso Amazon Web Services con sede a Palo Alto, CA. Jon lavora a stretto contatto con i team di CloudSearch ed Elasticsearch, fornendo assistenza e indicazioni a un'ampia gamma di clienti che hanno carichi di lavoro di ricerca che desiderano trasferire nel cloud AWS. Prima di entrare in AWS, la carriera di Jon come sviluppatore di software includeva quattro anni di codifica di un motore di ricerca e-commerce su larga scala.
- Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
- Platoblockchain. Web3 Metaverse Intelligence. Conoscenza amplificata. Accedi qui.
- Fonte: https://aws.amazon.com/blogs/big-data/migrate-your-indexes-to-amazon-opensearch-serverless-with-logstash/
- 000
- 10
- 100
- 28
- 39
- 7
- a
- Chi siamo
- accesso
- Secondo
- Raggiungere
- Action
- Dopo shavasana, sedersi in silenzio; saluti;
- contro
- Agente
- Tutti
- Amazon
- Amazon Web Services
- analitica
- ed
- ha annunciato
- api
- applicazioni
- disponibilità
- disponibile
- AWS
- basato
- prima
- Meglio
- fra
- ampio
- costruire
- CA
- Career
- casi
- CD
- il cambiamento
- cliente
- strettamente
- Cloud
- Cluster
- codice
- codifica
- collezione
- collezioni
- Commenti
- confronto
- completamento di una
- Completato
- Calcolare
- Configurazione
- Connettiti
- contenuto
- di controllo
- Comodo
- Costo
- creare
- Credenziali
- Clienti
- dati
- l'accesso ai dati
- dedicato
- Predefinito
- destinazione
- dettagli
- Costruttori
- diverso
- disabile
- documento
- documenti
- fare
- dominio
- domini
- giù
- mangiare
- ecommerce
- Efficace
- o
- elasticsearch
- endpoint
- motore
- Ambiente
- Etere (ETH)
- Anche
- EVER
- esempio
- supera
- esistente
- Esplorare
- estratto
- feedback
- campo
- Compila il
- filtri
- Trovare
- messa a fuoco
- i seguenti
- da
- pieno
- Generale
- ottenere
- ottenere
- Gruppo
- avendo
- Aiuto
- aiutato
- aiuta
- Come
- Tutorial
- HTTPS
- IAM
- Identità
- in
- incluso
- Index
- indici
- Indici
- info
- ingresso
- install
- interattivo
- IT
- accoppiamento
- Sapere
- larga scala
- con i più recenti
- IMPARARE
- caricare
- Principale
- make
- FA
- gestire
- gestito
- massimo
- Memorie
- migrare
- millisecondo
- verbale
- Scopri di più
- cambiano
- Film
- multiplo
- Nome
- Bisogno
- New
- GENERAZIONE
- open source
- Software open source
- OTTIMIZZA
- ottimizzati
- Opzione
- Opzioni
- Oss
- Altro
- palo Alto
- Password
- performance
- conduttura
- Partner
- Platone
- Platone Data Intelligence
- PlatoneDati
- plug-in
- i plugin
- Post
- Post
- prerequisiti
- Direttore
- Precedente
- i processi
- fornire
- fornisce
- fornitura
- metti
- Domande
- gamma
- Leggi
- recentemente
- regione
- registro
- rimosso
- rimozione
- ripetere
- richiesta
- Risorse
- risposta
- ritorno
- problemi
- Correre
- corridore
- running
- stesso
- Risparmi
- Scala
- Cerca
- motore di ricerca
- Sezione
- sezioni
- sicuro
- Serie
- serverless
- servizio
- Servizi
- set
- Corti
- fermare
- chiude
- simile
- semplicità
- semplicemente
- Software
- soluzione
- Soluzioni
- Fonte
- specialista
- Stage
- inizia a
- iniziato
- Passi
- conservazione
- inviare
- Con successo
- tale
- supporti
- le squadre
- I
- L’ORIGINE
- loro
- Attraverso
- volte
- a
- top
- trasferimento
- Trasformare
- trasformazioni
- viaggiare
- Di viaggio
- vero
- per
- Aggiornanento
- aggiornamento
- uso
- Utente
- Valori
- vario
- verificare
- versione
- via
- sito web
- servizi web
- quale
- OMS
- volere
- senza
- flusso di lavoro
- lavoro
- lavori
- laboratorio
- Corsi
- scrivere
- anni
- Trasferimento da aeroporto a Sharm
- zefiro