Amazon Kendra là một dịch vụ tìm kiếm thông minh dễ sử dụng cho phép bạn tích hợp khả năng tìm kiếm với các ứng dụng của mình để người dùng có thể tìm thấy thông tin được lưu trữ trên các nguồn dữ liệu như Dịch vụ lưu trữ đơn giản của Amazon , OneDrive và Google Drive; các ứng dụng như SalesForce, SharePoint và Service Now; và cơ sở dữ liệu quan hệ như Dịch vụ cơ sở dữ liệu quan hệ của Amazon (RDS của Amazon). Sử dụng trình kết nối Amazon Kendra cho phép bạn đồng bộ hóa dữ liệu từ nhiều kho lưu trữ nội dung với chỉ mục Amazon Kendra của bạn. Khi người dùng cuối đặt câu hỏi bằng ngôn ngữ tự nhiên, Amazon Kendra sử dụng thuật toán máy học (ML) để hiểu ngữ cảnh và đưa ra câu trả lời phù hợp nhất.
Trình kết nối S3 của Amazon Kendra hỗ trợ lập chỉ mục tài liệu và siêu dữ liệu liên quan của chúng được lưu trữ trong bộ chứa S3. Thông thường, bạn muốn đảm bảo rằng các ứng dụng chạy bên trong VPC chỉ có quyền truy cập vào các bộ chứa S3 cụ thể và trong nhiều trường hợp, kết nối không được đi qua internet để đến các điểm cuối công cộng. Tuy nhiên, nhiều khách hàng sở hữu nhiều bộ chứa S3, một số trong số đó có thể truy cập bằng Điểm cuối VPC cho Amazon S3. Trong bài đăng này, chúng tôi mô tả cách sử dụng trình kết nối Amazon Kendra S3 đã cập nhật với sự hỗ trợ của VPC để sử dụng các điểm cuối VPC.
Bài đăng này cung cấp các bước giúp bạn tạo công cụ tìm kiếm doanh nghiệp trên AWS bằng cách sử dụng Amazon Kendra bằng cách kết nối các tài liệu được lưu trữ trong bộ chứa S3 chỉ có thể truy cập được từ bên trong VPC. Để biết thêm thông tin, xem tăng cường tìm kiếm doanh nghiệp với Amazon Kendra. Bài đăng cũng trình bày cách định cấu hình trình kết nối của bạn cho Amazon S3 và định cấu hình cách chỉ mục của bạn đồng bộ hóa với nguồn dữ liệu khi nội dung nguồn dữ liệu của bạn thay đổi.
Tổng quan về giải pháp
Có ba cải tiến chính đối với Đầu nối Amazon Kendra S3 :
- hỗ trợ VPC – Trình kết nối hiện hỗ trợ sử dụng Đám mây riêng ảo Amazon (Amazon VPC) mạng. Giờ đây, bạn có thể kết nối an toàn với Amazon S3 bằng cách sử dụng Điểm cuối VPC cho Amazon S3 bằng cách chỉ định kết nối VPC, mạng con và nhóm bảo mật.
- Hai chế độ đồng bộ – Khi bạn lên lịch đồng bộ hóa nguồn dữ liệu trong Amazon S3 với chỉ mục Amazon Kendra, giờ đây bạn có thể chọn chạy ở chế độ Đồng bộ hóa hoàn toàn hoặc Chế độ đồng bộ hóa tài liệu mới, đã sửa đổi và đã xóa. Ở chế độ đồng bộ hóa đầy đủ, mỗi khi quá trình đồng bộ hóa chạy, nó sẽ quét các đối tượng trong mọi thư mục theo đường dẫn gốc mà nó đã được định cấu hình để thu thập thông tin và nhập lại tất cả tài liệu . Việc làm mới hoàn toàn cho phép bạn đặt lại chỉ mục mà không cần xóa và tạo nguồn dữ liệu mới. Ở chế độ đồng bộ hóa tài liệu Mới, đã sửa đổi và đã xóa, mỗi khi tác vụ đồng bộ hóa chạy, nó chỉ xử lý các đối tượng đã được thêm, sửa đổi hoặc xóa kể từ lần thu thập thông tin cuối cùng. Thu thập thông tin gia tăng có thể giảm thời gian chạy và chi phí khi được sử dụng với các bộ dữ liệu nối các đối tượng mới vào các nguồn dữ liệu hiện có một cách thường xuyên.
- Các mẫu bao gồm và loại trừ bổ sung cho tài liệu: Ngoài các tiền tố, chúng tôi đang giới thiệu các mẫu để bao gồm hoặc loại trừ các tài liệu khỏi chỉ mục của bạn. Hai loại mẫu được hỗ trợ là loại tập tin hoặc toàn cầu kiểu Unix. Giờ đây, bạn có thể thêm mẫu biểu thức chính quy để bao gồm các thư mục cụ thể hoặc loại trừ các thư mục, loại tệp hoặc tệp cụ thể khỏi nguồn dữ liệu của mình. Điều này có thể hữu ích cho các kho lưu trữ dữ liệu được chia sẻ có chứa nội dung thuộc các danh mục, phân loại và loại tệp khác nhau.
Điều kiện tiên quyết
Đối với hướng dẫn này, bạn nên có các điều kiện tiên quyết sau:
Tạo và định cấu hình kho lưu trữ tài liệu của bạn
Trước khi có thể tạo chỉ mục trong Amazon Kendra, bạn cần tải tài liệu vào nhóm S3. Phần này chứa các hướng dẫn để tạo nhóm S3, lấy tệp và tải chúng vào nhóm. Sau khi hoàn thành tất cả các bước trong phần này, bạn đã có một nguồn dữ liệu mà Amazon Kendra có thể sử dụng.
- trên Bảng điều khiển quản lý AWS, trong danh sách Khu vực, hãy chọn Miền Đông Hoa Kỳ (Bắc Virginia) hoặc bất kỳ Khu vực nào bạn chọn Amazon Kendra có sẵn trong.
- Chọn DỊCH VỤ.
- Theo Kho, chọn S3.
- Trên bảng điều khiển Amazon S3, chọn Tạo xô.
- Theo Cấu hình chung, cung cấp những thông tin dưới đây:
- Đối với tên nhóm, nhập
kendrapost-{your account id}.
- Đối với Khu vực, hãy chọn cùng Khu vực mà bạn sử dụng để triển khai chỉ mục Amazon Kendra của mình (bài đăng này sử dụng
us-east-1
). - Theo Cài đặt nhóm, cho Chặn truy cập công cộng, hãy để mọi thứ với các giá trị mặc định.
- Đối với tên nhóm, nhập
- Theo Cài đặt nâng cao, hãy để mọi thứ với các giá trị mặc định.
- Chọn Tạo xô.
- Tải về AWS_Whitepapers.zip và giải nén các tệp.
- Trên bảng điều khiển Amazon S3, chọn nhóm mà bạn vừa tạo và chọn Tải lên.
- Tải lên các thư mục
Best Practices
,Databases
,General
vàMachine Learning
từ tệp đã giải nén.
Bên trong thùng của bạn, bây giờ bạn sẽ thấy bốn thư mục.
Thêm nguồn dữ liệu
A nguồn dữ liệu là một vị trí lưu trữ các tài liệu để lập chỉ mục. Bạn có thể tự động đồng bộ hóa các nguồn dữ liệu với chỉ mục Amazon Kendra để đảm bảo rằng các tìm kiếm phản ánh chính xác các tài liệu mới, cập nhật hoặc đã xóa trong kho nguồn.
Sau khi hoàn thành tất cả các bước trong phần này, bạn sẽ có một nguồn dữ liệu được liên kết với Amazon Kendra. Để biết thêm thông tin, xem Thêm tài liệu từ nguồn dữ liệu.
Trước khi tiếp tục, hãy đảm bảo rằng quá trình tạo chỉ mục đã hoàn tất và chỉ mục hiển thị dưới dạng hoạt động. Để biết thêm thông tin, xem Tạo một chỉ mục.
- Trên bảng điều khiển Amazon Kendra, điều hướng đến chỉ mục của bạn (đối với bài đăng này,
kendra-blog-index
). - trên
kendra-blog-index
trang, chọn Thêm nguồn dữ liệu. - Trong Amazon S3, chọn Thêm trình kết nối.
Để biết thêm thông tin về các nguồn dữ liệu khác nhau mà Amazon Kendra hỗ trợ, hãy xem Thêm tài liệu từ nguồn dữ liệu.
- Trong tạp chí Chỉ định chi tiết nguồn dữ liệu phần, cho Tên nguồn dữ liệu, đi vào
aws_white_paper
. - Trong Mô tả, đi vào
AWS White Paper documentation
. - Chọn Sau.
Bây giờ bạn tạo một Quản lý truy cập và nhận dạng AWS (IAM) cho Amazon Kendra.
- Trong tạp chí Xác định quyền truy cập và bảo mật trang, cho Vai trò IAM phần, chọn Tạo một vai trò mới.
- Đối với Tên vai trò, hãy nhập
source-role
(tên vai trò của bạn có tiền tố làAmazonKendra-
). - Trong tạp chí Định cấu hình VPC và bảo mật phần, chọn của bạn VPC, và nhập của bạn Mạng con và nhóm bảo mật VPC.
Để biết thêm thông tin về cách kết nối Amazon Kendra với Amazon Virtual Private Cloud, hãy xem Định cấu hình Amazon Kendra để sử dụng VPC.
- Chọn Sau.
- Trong tạp chí Định cấu hình cài đặt đồng bộ hóa trang, cho Nhập vị trí nguồn dữ liệu, nhập nhóm S3 mà bạn đã tạo:
kendrapost-{your account id}
. - Rời bỏ Vị trí thư mục tiền tố tệp siêu dữ liệu chỗ trống.
Theo mặc định, các tệp siêu dữ liệu được lưu trữ trong cùng một thư mục với tài liệu. Nếu bạn muốn đặt các tệp này trong một thư mục khác, bạn có thể thêm tiền tố. Để biết thêm thông tin, hãy xem Siêu dữ liệu tài liệu Amazon S3.
- Trong Chọn khóa giải mã, bỏ chọn nó.
- Trong Cấu hình bổ sung, bạn có thể thêm một mẫu để bao gồm hoặc loại trừ một số thư mục hoặc tệp nhất định. Đối với bài đăng này, hãy giữ các giá trị mặc định.
- Trong Chế độ đồng bộ hóa chọn Đồng bộ hóa tài liệu mới, sửa đổi hoặc đã xóa.
- Trong tần số, chọn Chạy theo yêu cầu.
Bước này xác định tần suất nguồn dữ liệu được đồng bộ hóa với chỉ mục Amazon Kendra.
- Chọn Sau.
- Trong tạp chí Đặt ánh xạ trường trang, giữ các giá trị mặc định.
- Chọn Sau.
- trên Xem lại và tạo trang, chọn Thêm nguồn dữ liệu.
- Điều hướng trở lại chỉ mục Kendra của bạn.
- Lựa chọn của bạn Nguồn dữ liệu, sau đó chọn Đồng bộ hóa ngay bây giờ để đồng bộ hóa các tài liệu với chỉ mục Amazon Kendra.
Thời lượng của quá trình này phụ thuộc vào số lượng tài liệu mà bạn lập chỉ mục. Đối với trường hợp sử dụng này, có thể mất 15 phút, sau đó bạn sẽ thấy thông báo đồng bộ hóa thành công. Trong phần Lịch sử chạy đồng bộ hóa, bạn có thể thấy 40 tài liệu đã được đồng bộ hóa.
Chỉ mục Amazon Kendra của bạn hiện đã sẵn sàng cho các truy vấn ngôn ngữ tự nhiên. Khi bạn tìm kiếm chỉ mục của mình, Amazon Kendra sử dụng tất cả dữ liệu và siêu dữ liệu được cung cấp để trả về câu trả lời chính xác nhất cho truy vấn tìm kiếm của bạn. Trên bảng điều khiển Amazon Kendra, chọn Tìm kiếm nội dung được lập chỉ mục. Trong trường truy vấn, hãy bắt đầu bằng một truy vấn chẳng hạn như “Dịch vụ AWS nào có độ bền 11 điểm chín?”
Để biết thêm thông tin về truy vấn chỉ mục, hãy xem Truy vấn một chỉ mục
Đồng bộ hóa các thay đổi nguồn dữ liệu để tìm kiếm chỉ mục
Nguồn dữ liệu của bạn được thiết lập để đồng bộ hóa mọi dữ liệu mới, đã sửa đổi hoặc đã xóa. Trước khi bạn có thể đồng bộ hóa dần dần nguồn dữ liệu của mình với một chỉ mục trong Amazon Kendra, bạn cần tải tài liệu mới vào bộ chứa S3.
- Trên bảng điều khiển Amazon S3, chọn nhóm mà bạn vừa tạo và chọn Tải lên.
- Tải lên các thư mục
Security
vàWell_Architected
từ tệp đã giải nén.
Giờ đây, bạn có thể đồng bộ hóa các tài liệu mới được thêm vào bộ chứa S3:
- Trên bảng điều khiển Amazon Kendra, chọn Nguồn dữ liệu rồi chọn nguồn dữ liệu S3 của bạn.
- Chọn Đồng bộ hóa ngay.
Thời gian của quá trình này phụ thuộc vào số lượng tài liệu mà bạn lập chỉ mục. Đối với trường hợp sử dụng này, có thể mất 15 phút, sau đó bạn sẽ thấy thông báo đồng bộ hóa thành công.
Trong tạp chí Đồng bộ hóa lịch sử chạy , bạn có thể thấy rằng 20 tài liệu đã được đồng bộ hóa.
Lập chỉ mục lại nguồn dữ liệu
Trong trường hợp nguồn dữ liệu có thông tin cũ, giờ đây bạn có thể lập chỉ mục lại nguồn dữ liệu mà không phải xóa và tạo nguồn dữ liệu mới. Để sửa đổi chế độ đồng bộ hóa và lập chỉ mục lại nguồn dữ liệu, hãy hoàn thành các bước sau:
- Trên bảng điều khiển Amazon Kendra, chọn Nguồn dữ liệu rồi chọn nguồn dữ liệu S3 của bạn.
- trên Hoạt động menu, chọn Chỉnh sửa.
- Chọn Sau chuyển đến Bước 3 – Cấu hình trang cài đặt đồng bộ hóa.
- Đối với chế độ Đồng bộ hóa, hãy chọn Đồng bộ đầy đủ.
- Trong tần số, chọn Chạy theo yêu cầu.
- Chọn Sau.
- Trong tạp chí Đặt ánh xạ trường trang, giữ các giá trị mặc định.
- Chọn Sau.
- trên Xem lại và tạo trang, chọn Cập nhật.
Giờ đây, bạn có thể đồng bộ hóa các tài liệu mới được thêm vào bộ chứa S3.
- Trên bảng điều khiển Amazon Kendra, chọn Nguồn dữ liệu rồi chọn nguồn dữ liệu S3 của bạn.
- Chọn Đồng bộ hóa ngay.
Trong tạp chí Đồng bộ hóa lịch sử chạy bạn có thể thấy rằng tất cả các tài liệu đã được đồng bộ hóa bất kể trạng thái đồng bộ hóa trước đó trong cột đã sửa đổi.
Làm sạch
Để tránh phát sinh các khoản phí trong tương lai và để xóa các vai trò và chính sách không sử dụng, hãy xóa các tài nguyên bạn đã tạo:
- Trên chỉ mục Amazon Kendra, chọn Chỉ số trong khung điều hướng.
- Chọn chỉ mục bạn đã tạo và trên Hoạt động menu, chọn Xóa bỏ.
- Để xác nhận xóa, hãy nhập Xóa khi được nhắc và chọn Xóa bỏ.
Chờ cho đến khi bạn nhận được thông báo xác nhận; quá trình này có thể mất đến 15 phút.
- Trên bảng điều khiển Amazon S3, xóa thùng S3.
- Trên bảng điều khiển IAM, xóa các vai trò IAM tương ứng.
Kết luận
Trong bài đăng này, bạn đã học cách sử dụng Amazon Kendra để triển khai dịch vụ tìm kiếm doanh nghiệp bằng cách sử dụng kết nối an toàn với Amazon S3 không yêu cầu cổng internet hoặc thiết bị Dịch địa chỉ mạng (NAT). Bạn có thể bật đồng bộ hóa nhanh hơn cho tài liệu của mình bằng chế độ đồng bộ hóa.
Có nhiều tính năng bổ sung mà chúng tôi không đề cập. Ví dụ:
- Bạn có thể bật kiểm soát truy cập dựa trên người dùng cho chỉ mục Amazon Kendra của mình và hạn chế quyền truy cập vào tài liệu dựa trên kiểm soát truy cập mà bạn đã định cấu hình.
- Bạn có thể ánh xạ các thuộc tính đối tượng tới các thuộc tính chỉ mục của Amazon Kendra và kích hoạt chúng để tạo mặt, tìm kiếm và hiển thị trong kết quả tìm kiếm.
- Bạn có thể nhanh chóng tìm thông tin từ các trang web (bảng HTML) bằng tính năng tìm kiếm dạng bảng của Amazon Kendra
Để tìm hiểu thêm về Amazon Kendra, hãy tham khảo Hướng dẫn dành cho nhà phát triển Amazon Kendra.
Về các tác giả
Maran Chandrasekaran là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services, làm việc với các khách hàng doanh nghiệp của chúng tôi. Ngoài công việc, anh ấy thích đi du lịch.
Arjun Agrawal là Kỹ sư phần mềm tại AWS, hiện đang làm việc với nhóm Amazon Kendra trên một công cụ tìm kiếm dành cho doanh nghiệp. Anh ấy đam mê công nghệ mới và giải quyết các vấn đề trong thế giới thực. Ngoài công việc, anh ấy thích đi bộ đường dài và du lịch.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- Giới thiệu
- truy cập
- có thể truy cập
- Tài khoản
- chính xác
- chính xác
- ngang qua
- thêm
- Ngoài ra
- thêm vào
- địa chỉ
- Sau
- thuật toán
- Tất cả
- cho phép
- Đã
- đàn bà gan dạ
- Amazon Kendra
- Amazon RDS
- Amazon Web Services
- và
- câu trả lời
- các ứng dụng
- liên kết
- thuộc tính
- tự động
- có sẵn
- tránh
- AWS
- trở lại
- dựa
- cơ sở
- trước
- khả năng
- trường hợp
- trường hợp
- đố
- nhất định
- Những thay đổi
- tải
- sự lựa chọn
- Chọn
- phân loại
- đám mây
- Cột
- hoàn thành
- hoàn thành
- Xác nhận
- Kết nối
- Kết nối
- liên quan
- An ủi
- chứa
- nội dung
- bối cảnh
- tiếp tục
- điều khiển
- điều khiển
- đúng
- Tương ứng
- Phí Tổn
- che
- tạo
- tạo ra
- tạo
- Hiện nay
- khách hàng
- dữ liệu
- Cơ sở dữ liệu
- cơ sở dữ liệu
- bộ dữ liệu
- Mặc định
- Xác định
- chứng minh
- phụ thuộc
- triển khai
- mô tả
- Nhà phát triển
- thiết bị
- khác nhau
- Giao diện
- tài liệu
- tài liệu
- Không
- lái xe
- Độ bền
- Đông
- dễ sử dụng
- cho phép
- cho phép
- Động cơ
- ky sư
- đăng ký hạng mục thi
- Doanh nghiệp
- khách hàng doanh nghiệp
- Tìm kiếm doanh nghiệp
- Ether (ETH)
- Mỗi
- tất cả mọi thứ
- ví dụ
- hiện tại
- Tính năng
- lĩnh vực
- Tập tin
- Các tập tin
- Tìm kiếm
- tiếp theo
- tần số
- từ
- Full
- tương lai
- cửa ngõ
- được
- Các nhóm
- có
- giúp đỡ
- Đi lang thang
- lịch sử
- Độ đáng tin của
- Hướng dẫn
- Tuy nhiên
- HTML
- HTTPS
- IAM
- Bản sắc
- cải tiến
- in
- bao gồm
- đưa vào
- chỉ số
- thông tin
- hướng dẫn
- tích hợp
- Thông minh
- Internet
- giới thiệu
- không phân biệt
- IT
- Việc làm
- Giữ
- Ngôn ngữ
- Họ
- LEARN
- học
- học tập
- Rời bỏ
- liên kết
- Danh sách
- tải
- địa điểm thư viện nào
- máy
- học máy
- Chủ yếu
- làm cho
- quản lý
- nhiều
- bản đồ
- Menu
- tin nhắn
- Siêu dữ liệu
- phút
- ML
- Chế độ
- chế độ
- sửa đổi
- sửa đổi
- chi tiết
- hầu hết
- di chuyển
- nhiều
- tên
- Tự nhiên
- Ngôn ngữ tự nhiên
- Điều hướng
- THÔNG TIN
- Cần
- mạng
- mạng
- Mới
- con số
- vật
- đối tượng
- OneDrive
- bên ngoài
- riêng
- cửa sổ
- Giấy
- đam mê
- con đường
- Họa tiết
- mô hình
- Nơi
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Chính sách
- Bài đăng
- điều kiện tiên quyết
- trước
- riêng
- vấn đề
- quá trình
- Quy trình
- cho
- cung cấp
- cung cấp
- công khai
- Câu hỏi
- nhanh hơn
- Mau
- đạt
- sẵn sàng
- thế giới thực
- giảm
- phản ánh
- khu
- đều đặn
- có liên quan
- yêu cầu
- Thông tin
- hạn chế
- Kết quả
- trở lại
- Vai trò
- vai trò
- nguồn gốc
- chạy
- chạy
- lực lượng bán hàng
- tương tự
- kịch bản
- lịch trình
- Tìm kiếm
- công cụ tìm kiếm
- Phần
- an toàn
- an toàn
- an ninh
- cao cấp
- dịch vụ
- DỊCH VỤ
- định
- thiết lập
- chia sẻ
- SharePoint
- nên
- Chương trình
- Đơn giản
- kể từ khi
- So
- Phần mềm
- Kỹ sư phần mềm
- Giải pháp
- Giải quyết
- một số
- nguồn
- nguồn
- riêng
- Bắt đầu
- Trạng thái
- Bước
- Các bước
- là gắn
- lưu trữ
- cửa hàng
- phong cách
- subnet
- mạng con
- thành công
- như vậy
- hỗ trợ
- Hỗ trợ
- Hỗ trợ
- đồng bộ hóa
- Hãy
- nhóm
- Công nghệ
- Sản phẩm
- Nguồn
- cung cấp their dịch
- số ba
- thời gian
- đến
- Dịch
- đi du lịch
- loại
- Dưới
- hiểu
- unix
- không sử dụng
- cập nhật
- us
- sử dụng
- ca sử dụng
- Người sử dụng
- Các giá trị
- virginia
- ảo
- hương
- web
- các dịch vụ web
- cái nào
- trắng
- giấy trắng
- ở trong
- không có
- Công việc
- đang làm việc
- trên màn hình
- zephyrnet
- Zip