New Expanded Data Format Support In Amazon Kendra

Republicat de Platon

Urmaritori: 0

Întreprinderile din întreaga lume caută să utilizeze mai multe surse de date pentru a implementa o experiență de căutare unificată pentru angajații și clienții finali. Având în vedere volumul mare de date care trebuie examinate și indexate, viteza de recuperare, scalabilitatea soluției și performanța căutării devin factori cheie de luat în considerare atunci când alegeți o soluție de căutare inteligentă pentru întreprinderi. În plus, aceste surse de date unice cuprind depozite de conținut structurate și nestructurate – inclusiv diferite tipuri de fișiere – care pot cauza probleme de compatibilitate.

Amazon Kendra este un serviciu de căutare foarte precis și inteligent, care permite utilizatorilor să caute răspunsuri la întrebările lor din datele dvs. nestructurate și structurate, folosind procesarea limbajului natural și algoritmi de căutare avansați. Acesta returnează răspunsuri specifice la întrebări, oferind utilizatorilor o experiență care este aproape de interacțiunea cu un expert uman.

Astăzi, Amazon Kendra a lansat șapte opțiuni suplimentare de suport pentru format de date pe care le puteți utiliza. Acest lucru vă permite să integrați cu ușurință sursele de date existente așa cum sunt și să efectuați căutare inteligentă în mai multe depozite de conținut.

În această postare, discutăm despre noile formate de date acceptate și despre cum să le folosim.

Noi formate de date acceptate

Anterior, Amazon Kendra documente susținute care includea text structurat sub formă de întrebări și răspunsuri frecvente, precum și text nestructurat sub formă de fișiere HTML, prezentări Microsoft PowerPoint, documente Microsoft Word, documente cu text simplu și PDF-uri.

Odată cu această lansare, Amazon Kendra oferă acum suport pentru șapte formate de date suplimentare:

Format text îmbogățit (RTF)
Notarea obiectelor JavaScript (JSON)
Reducere (MD)
Valori separate prin virgulă (CSV)
Microsoft Excel (MS Excel)
Limbaj extensibil de marcare (XML)
Transformări de limbă de foaie de stil extensibile (XSLT)

Utilizatorii Amazon Kendra pot asimila aceste documente cu diferite formate de date în indexul lor în următoarele două moduri:

Prezentare generală a soluțiilor

În secțiunile următoare, parcurgem pașii pentru adăugarea documentelor dintr-o sursă de date și efectuarea unei căutări pe acele documente.

Următoarea diagramă arată arhitectura soluției noastre.

Pentru a testa această soluție pentru oricare dintre formatele acceptate, trebuie să utilizați propriile date. Puteți testa prin încărcarea documentelor de același format sau de formate diferite în bucket-ul S3.

Creați un index Amazon Kendra

Pentru instrucțiuni despre crearea indexului Amazon Kendra, consultați Crearea unui index.

Puteți sări peste acest pas dacă aveți un index preexistent de utilizat pentru această demonstrație.

Încărcați documente într-o găleată S3 și ingerați în index folosind conectorul S3

Parcurgeți următorii pași pentru a conecta o găleată S3 la index:

Creați o găleată S3 pentru a vă stoca documentele.
Creați un folder numite eșantion-date.
Încărcați în dosar documentele pe care doriți să le testați.
Pe consola Amazon Kendra, accesați indexul dvs. și alegeți Surse de date.
Alege Adăugați o sursă de date.
În Surse de date disponibile, Selectați S3 Și alegeți Adăugați conector.
Introduceți un nume pentru conectorul dvs. (cum ar fi Demo_S3_connector) și alegeți Pagina Următoare →.
Alege Răsfoiți S3 și alegeți găleata S3 în care ați încărcat documentele.
Pentru Rolul IAM, creați un nou rol.
Pentru Setați programul de rulare a sincronizării, Selectați Fugi la cerere.
Alege Pagina Următoare →.
Pe Examinați și creați pagina, alege Adăugați o sursă de date.
După finalizarea procesului de creare, alegeți Sincronizați acum.

Acum că ați ingerat câteva documente, puteți naviga la consola de căutare încorporată pentru a testa interogările.

Căutați documentele dvs. cu consola de căutare Amazon Kendra

Pe consola Amazon Kendra, alegeți Căutați conținut indexat în panoul de navigare.

Următoarele sunt exemple de rezultate ale căutării diferitelor tipuri de documente:

RTF – Introduceți date în format RTF încărcate în compartimentul S3 și sincronizați sursa de date: