Amazon Kendra är en lättanvänd intelligent söktjänst som låter dig integrera sökfunktioner med dina applikationer så att användare kan hitta information lagrad i datakällor som t.ex. Amazon enkel lagringstjänst , OneDrive och Google Drive; applikationer som SalesForce, SharePoint och Service Now; och relationsdatabaser som Amazon Relational Databas Service (Amazon RDS). Genom att använda Amazon Kendra-anslutningar kan du synkronisera data från flera innehållsförråd med ditt Amazon Kendra-index. När slutanvändare ställer frågor om naturligt språk använder Amazon Kendra algoritmer för maskininlärning (ML) för att förstå sammanhanget och returnera de mest relevanta svaren.
Amazon Kendras S3-kontakt stöder indexering av dokument och deras tillhörande metadata lagrade i en S3-hink. Det är ofta så att du vill försäkra dig om att applikationer som körs inuti en VPC endast har tillgång till specifika S3-buckets och i många fall får anslutningen inte passera internet för att nå offentliga slutpunkter. Många kunder äger dock flera S3-hinkar, av vilka några är tillgängliga för VPC-slutpunkter för Amazon S3. I det här inlägget beskriver vi hur du använder den uppdaterade Amazon Kendra S3-kontakten med VPC-stöd för att använda VPC-slutpunkter.
Det här inlägget innehåller stegen för att hjälpa dig att skapa en företagssökmotor på AWS med Amazon Kendra genom att ansluta dokument lagrade i en S3-hink som endast är tillgänglig från en VPC. För mer information, se förbättra företagssökning med Amazon Kendra. Inlägget visar också hur du konfigurerar din anslutning för Amazon S3 och konfigurerar hur ditt index synkroniseras med din datakälla när innehållet i din datakälla ändras.
Översikt över lösningen
Det finns tre huvudsakliga förbättringar av Amazon Kendra S3-kontakt :
- VPC-stöd – Kontakten stöder nu användning av din Amazon Virtual Private Cloud (Amazon VPC) nätverk. Du kan nu säkert ansluta till Amazon S3 med hjälp av VPC-slutpunkter för Amazon S3 genom att ange VPC-anslutningen, subnät och säkerhetsgrupper.
- Två synklägen – När du schemalägger synkronisering av en datakälla i Amazon S3 till ett Amazon Kendra-index, kan du nu välja att köra i Fullsync-läge eller Nytt, ändrat och raderat dokumentsynkroniseringsläge. I läget för fullständig synkronisering, varje gång synkroniseringen körs, skannar den objekt i varje mapp under rotsökvägen som den konfigurerades för att genomsöka och återinför alla dokument . Den fullständiga uppdateringen gör att du kan återställa indexet utan att behöva ta bort och skapa en ny datakälla. I synkroniseringsläget för nya, ändrade och borttagna dokument, varje gång synkroniseringsjobbet körs, bearbetar det endast objekt som har lagts till, ändrats eller tagits bort sedan den senaste genomsökningen. Inkrementella genomsökningar kan minska körtid och kostnader när de används med datauppsättningar som regelbundet lägger till nya objekt till befintliga datakällor.
- Ytterligare inkluderings- och exkluderingsmönster för dokument: Förutom prefix introducerar vi mönster för inkludering eller exkludering av dokument från ditt index. Två mönstertyper som stöds är glob- eller filtyper i Unix-stil. Du kan nu lägga till ett reguljärt uttrycksmönster för att inkludera specifika mappar eller exkludera mappar, filtyper eller specifika filer från din datakälla. Detta kan vara användbart för delade dataförråd som innehåller innehåll som tillhör olika kategorier, klassificeringar och filtyper.
Förutsättningar
För detta genomgång bör du ha följande förutsättningar:
Skapa och konfigurera ditt dokumentarkiv
Innan du kan skapa ett index i Amazon Kendra måste du ladda dokument i en S3-hink. Det här avsnittet innehåller instruktioner för att skapa en S3-hink, hämta filerna och ladda dem i hinken. När du har slutfört alla stegen i det här avsnittet har du en datakälla som Amazon Kendra kan använda.
- På AWS Management Console, i listan Region, välj US East (N. Virginia) eller valfri region som du väljer Amazon Kendra finns i.
- Välja Tjänster.
- Enligt lagringväljer S3.
- Välj på Amazon S3-konsolen Skapa hink.
- Enligt Allmän konfiguration, Lämna följande information:
- För hinknamn, Till New Earth
kendrapost-{your account id}.
- För Region, välj samma region som du använder för att distribuera ditt Amazon Kendra-index (det här inlägget använder
us-east-1
). - Enligt Inställningar för hink, för Blockera allmän tillgång, lämna allt med standardvärdena.
- För hinknamn, Till New Earth
- Enligt Avancerade inställningar, lämna allt med standardvärdena.
- Välja Skapa hink.
- Download AWS_Whitepapers.zip och packa upp filerna.
- På Amazon S3-konsolen väljer du hinken som du just har skapat och välj Ladda.
- Ladda upp mapparna
Best Practices
,Databases
,General
ochMachine Learning
från den uppackade filen.
Inuti din hink bör du nu se fyra mappar.
Lägg till en datakälla
A datakälla är en plats som lagrar dokumenten för indexering. Du kan synkronisera datakällor automatiskt med ett Amazon Kendra-index för att se till att sökningar korrekt återspeglar nya, uppdaterade eller raderade dokument i källförvaret.
När du har slutfört alla steg i det här avsnittet har du en datakälla kopplad till Amazon Kendra. För mer information, se Lägga till dokument från en datakälla.
Innan du fortsätter, se till att indexskapandet är klart och att indexet visas som Aktiva. För mer information, se Skapa ett index.
- På Amazon Kendra-konsolen, navigera till ditt index (för det här inlägget,
kendra-blog-index
). - På
kendra-blog-index
sida, välj Lägg till datakällor. - Välj under Amazon S3 Lägg till kontakt.
För mer information om de olika datakällor som Amazon Kendra stöder, se Lägga till dokument från en datakälla.
- I Ange information om datakällan avsnitt, för Datakällans namn, stiga på
aws_white_paper
. - För Beskrivning, stiga på
AWS White Paper documentation
. - Välja Nästa.
Nu skapar du en AWS identitets- och åtkomsthantering (IAM) roll för Amazon Kendra.
- I Definiera åtkomst och säkerhet sida, för IAM-roll avsnitt väljer Skapa en ny roll.
- Ange för Rollnamn
source-role
(ditt rollnamn är förinställd medAmazonKendra-
). - I Konfigurera VPC och säkerhet sektion, välj din VPC, och skriv in din Subnät och VPC-säkerhetsgrupper.
För mer information om hur du ansluter din Amazon Kendra till ditt Amazon Virtual Private Cloud, se Konfigurera Amazon Kendra för att använda en VPC.
- Välja Nästa.
- I Konfigurera synkroniseringsinställningar sida, för Ange datakällans plats, ange S3-hinken du skapade:
kendrapost-{your account id}
. - Lämna Metadata filer prefix mapp plats tom.
Som standard lagras metadatafiler i samma katalog som dokumenten. Om du vill placera dessa filer i en annan mapp kan du lägga till ett prefix. För mer information, se Amazon S3-dokumentmetadata.
- För Välj dekrypteringsnyckel, låt det avmarkeras.
- För Ytterligare konfiguration, kan du lägga till ett mönster för att inkludera eller utesluta vissa mappar eller filer. För det här inlägget ska du hålla standardvärdena.
- För Synkroniseringsläge välja Nya, ändrade eller borttagna dokument synkroniseras.
- För Frekvensväljer Kör på begäran.
Det här steget definierar frekvensen med vilken datakällan synkroniseras med Amazon Kendra-index.
- Välja Nästa.
- I Ställ in fältmappningar sida, behåll standardvärdena.
- Välja Nästa.
- På Granska och skapa sida, välj Lägg till datakälla.
- Navigera tillbaka till ditt Kendra-index.
- Välj DatakällaOch välj sedan Synkronisera nu för att synkronisera dokumenten med Amazon Kendra-indexet.
Varaktigheten av denna process beror på antalet dokument som du indexerar. För det här användningsfallet kan det ta 15 minuter, varefter du bör se ett meddelande om att synkroniseringen lyckades. I avsnittet Synkkörningshistorik kan du se att 40 dokument synkroniserades.
Ditt Amazon Kendra-index är nu redo för naturliga språkfrågor. När du söker i ditt index använder Amazon Kendra all data och metadata som tillhandahålls för att returnera de mest exakta svaren på din sökfråga. Välj på Amazon Kendra-konsolen Sök efter indexerat innehåll. I frågefältet börjar du med en fråga som "Vilken AWS-tjänst har 11 nior av hållbarhet?"
För mer information om att fråga efter indexet, se Fråga efter ett index
Synkronisera datakällaändringar för att söka i indexet
Din datakälla är inställd för att synkronisera all ny, modifierad eller raderad data. Innan du kan synkronisera din datakälla stegvis med ett index i Amazon Kendra måste du ladda nya dokument i en S3-hink.
- På Amazon S3-konsolen väljer du hinken som du just har skapat och välj Ladda.
- Ladda upp mapparna
Security
ochWell_Architected
från den uppackade filen.
Nu kan du synkronisera de nya dokumenten som lagts till i S3-hinken:
- Välj på Amazon Kendra-konsolen Datakällor och välj sedan din S3-datakälla.
- Välja Synkronisera nu.
Processens längd beror på antalet dokument som du indexerar. För detta användningsfall kan det ta 15 minuter, varefter du ska se ett meddelande om att synkroniseringen var framgångsrik.
I Synkronisera körhistorik kan du se att 20 XNUMX dokument synkroniserades.
Indexera om datakällan
I ett scenario där datakällan har inaktuell information kan du nu indexera om datakällan utan att behöva ta bort och skapa en ny datakälla. För att ändra synkroniseringsläget och indexera om datakällan, utför följande steg:
- Välj på Amazon Kendra-konsolen Datakällor och välj sedan din S3-datakälla.
- På Handlingar meny, välj Edit.
- Välja Nästa att flytta till Steg 3 – Konfigurera sidan med synkroniseringsinställningar.
- För synkroniseringsläge, välj Full synk.
- För Frekvensväljer Kör på begäran.
- Välja Nästa.
- I Ställ in fältmappningar sida, behåll standardvärdena.
- Välja Nästa.
- På Granska och skapa sida, välj Uppdatering.
Nu kan du synkronisera de nya dokument som lagts till i S3-hinken.
- Välj på Amazon Kendra-konsolen Datakällor och välj sedan din S3-datakälla.
- Välja Synkronisera nu.
I Synkronisera körhistorik kan du se att alla dokument synkroniserades oavsett föregående synkroniseringsstatus under den modifierade kolumnen.
Städa upp
För att undvika framtida avgifter och rensa bort oanvända roller och policyer, radera resurserna du skapade:
- Välj på Amazon Kendra-index Index i navigeringsfönstret.
- Välj indexet du skapade och på Handlingar meny, välj Radera.
- För att bekräfta raderingen, ange Ta bort när du uppmanas att göra det och välj Radera.
Vänta tills du får bekräftelsemeddelandet; processen kan ta upp till 15 minuter.
- På Amazon S3 -konsolen, ta bort S3-hinken.
- På IAM-konsolen, ta bort motsvarande IAM-roller.
Slutsats
I det här inlägget lärde du dig hur du använder Amazon Kendra för att distribuera en företagssöktjänst med en säker anslutning till Amazon S3 som inte kräver en internetgateway eller NAT-enhet (Network Address Translation). Du kan aktivera snabbare synkroniseringar för dina dokument med synkroniseringsläget.
Det finns många ytterligare funktioner som vi inte täckte. Till exempel:
- Du kan aktivera användarbaserad åtkomstkontroll för ditt Amazon Kendra-index och begränsa åtkomsten till dokument baserat på de åtkomstkontroller du redan har konfigurerat.
- Du kan mappa objektattribut till Amazon Kendra-indexattribut och aktivera dem för fasettering, sökning och visning i sökresultaten.
- Du kan snabbt hitta information från webbsidor (HTML-tabeller) med Amazon Kendra-sökning i tabellform
För att lära dig mer om Amazon Kendra, se Amazon Kendra utvecklarguide.
Om författarna
Maran Chandrasekaran är Senior Solutions Architect på Amazon Web Services och arbetar med våra företagskunder. Utanför jobbet älskar han att resa.
Arjun Agrawal är mjukvaruingenjör på AWS och arbetar för närvarande med ett Amazon Kendra-team på en sökmotor för företag. Han brinner för ny teknik och för att lösa verkliga problem. Utanför jobbet älskar han att vandra och resa.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- Platoblockchain. Web3 Metaverse Intelligence. Kunskap förstärkt. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- Om oss
- tillgång
- tillgänglig
- Konto
- exakt
- exakt
- tvärs
- lagt till
- Dessutom
- Annat
- adress
- Efter
- algoritmer
- Alla
- tillåter
- redan
- amason
- Amazon Kendra
- Amazon RDS
- Amazon Web Services
- och
- svar
- tillämpningar
- associerad
- attribut
- automatiskt
- tillgänglig
- undvika
- AWS
- tillbaka
- baserat
- grund
- innan
- kapacitet
- Vid
- fall
- kategorier
- vissa
- Förändringar
- avgifter
- val
- Välja
- klassificering
- cloud
- Kolumn
- fullborda
- fullborda
- Bekräfta
- Kontakta
- Anslutning
- anslutning
- Konsol
- innehåller
- innehåll
- sammanhang
- fortsätter
- kontroll
- kontroller
- korrekt
- Motsvarande
- Pris
- täcka
- skapa
- skapas
- skapande
- För närvarande
- Kunder
- datum
- Databas
- databaser
- datauppsättningar
- Standard
- definierar
- demonstrerar
- beror
- distribuera
- beskriva
- Utvecklare
- anordning
- olika
- Visa
- dokumentera
- dokument
- inte
- driv
- hållbarhet
- öster
- LÄTTANVÄND
- möjliggöra
- möjliggör
- Motor
- ingenjör
- ange
- Företag
- företagskunder
- Företagssökning
- Eter (ETH)
- Varje
- allt
- exempel
- befintliga
- Funktioner
- fält
- Fil
- Filer
- hitta
- efter
- Frekvens
- från
- full
- framtida
- nätbryggan
- skaffa sig
- Gruppens
- har
- hjälpa
- Vandra
- historia
- Hur ser din drömresa ut
- How To
- Men
- html
- HTTPS
- IAM
- Identitet
- förbättringar
- in
- innefattar
- integration
- index
- informationen
- instruktioner
- integrera
- Intelligent
- Internet
- införa
- oavsett
- IT
- Jobb
- Ha kvar
- språk
- Efternamn
- LÄRA SIG
- lärt
- inlärning
- Lämna
- kopplade
- Lista
- läsa in
- läge
- Maskinen
- maskininlärning
- Huvudsida
- göra
- ledning
- många
- karta
- Meny
- meddelande
- metadata
- minuter
- ML
- Mode
- lägen
- modifierad
- modifiera
- mer
- mest
- flytta
- multipel
- namn
- Natural
- Naturligt språk
- Navigera
- Navigering
- Behöver
- nät
- nätverk
- Nya
- antal
- objektet
- objekt
- OneDrive
- utanför
- egen
- panelen
- Papper
- brinner
- bana
- Mönster
- mönster
- Plats
- plato
- Platon Data Intelligence
- PlatonData
- Strategier
- Inlägg
- förutsättningar
- föregående
- privat
- problem
- process
- processer
- ge
- förutsatt
- ger
- allmän
- frågor
- snabbare
- snabbt
- nå
- redo
- verkliga världen
- minska
- reflektera
- region
- regelbunden
- relevanta
- kräver
- Resurser
- begränsa
- Resultat
- avkastning
- Roll
- roller
- rot
- Körning
- rinnande
- Salesforce
- Samma
- scenario
- tidtabellen
- Sök
- sökmotor
- §
- säkra
- säkert
- säkerhet
- senior
- service
- Tjänster
- in
- inställningar
- delas
- sharepoint
- skall
- Visar
- Enkelt
- eftersom
- So
- Mjukvara
- Programvara ingenjör
- Lösningar
- Lösa
- några
- Källa
- Källor
- specifik
- starta
- status
- Steg
- Steg
- förvaring
- lagras
- lagrar
- stil
- undernät
- subnät
- framgångsrik
- sådana
- stödja
- Som stöds
- Stöder
- synkronisering
- Ta
- grupp
- Teknologi
- Smakämnen
- källan
- deras
- tre
- tid
- till
- Översättning
- färdas
- typer
- under
- förstå
- unix
- oanvänd
- uppdaterad
- us
- användning
- användningsfall
- användare
- Värden
- Virginia
- Virtuell
- genomgång
- webb
- webbservice
- som
- vit
- vitt papper
- inom
- utan
- Arbete
- arbetssätt
- Din
- zephyrnet
- Postnummer