آمازون کندرا یک سرویس جستجوی هوشمند با استفاده آسان است که به شما امکان می دهد قابلیت های جستجو را با برنامه های خود ادغام کنید تا کاربران بتوانند اطلاعات ذخیره شده در منابع داده مانند سرویس ذخیره سازی ساده آمازون ، OneDrive و Google Drive. برنامه هایی مانند SalesForce، SharePoint و Service Now. و پایگاه داده های رابطه ای مانند سرویس پایگاه داده رابطه آمازون (آمازون RDS). استفاده از رابطهای آمازون کندرا به شما امکان میدهد دادههای چندین مخزن محتوا را با فهرست آمازون کندرا همگامسازی کنید. هنگامی که کاربران نهایی سوالات زبان طبیعی را می پرسند، آمازون کندرا از الگوریتم های یادگیری ماشین (ML) برای درک زمینه و ارائه مرتبط ترین پاسخ ها استفاده می کند.
کانکتور S3 آمازون کندرا از اسناد نمایه سازی و ابرداده مرتبط با آنها که در یک سطل S3 ذخیره شده اند پشتیبانی می کند. اغلب اتفاق می افتد که می خواهید مطمئن شوید که برنامه های در حال اجرا در داخل VPC فقط به سطل های خاص S3 دسترسی دارند و در بسیاری از موارد اتصال نباید از اینترنت عبور کند تا به نقاط پایانی عمومی برسد. با این حال، بسیاری از مشتریان دارای چندین سطل S3 هستند که برخی از آنها توسط آنها قابل دسترسی هستند نقاط پایانی VPC برای Amazon S3. در این پست نحوه استفاده از کانکتور به روز شده Amazon Kendra S3 با پشتیبانی VPC برای استفاده از نقاط پایانی VPC را شرح می دهیم.
این پست مراحلی را ارائه می دهد که به شما کمک می کند با اتصال اسناد ذخیره شده در یک سطل S3 که فقط از داخل VPC قابل دسترسی است، یک موتور جستجوی سازمانی در AWS با استفاده از Amazon Kendra ایجاد کنید. برای اطلاعات بیشتر ببین افزایش جستجوی سازمانی با آمازون کندرا. این پست همچنین نحوه پیکربندی کانکتور خود را برای آمازون S3 و پیکربندی نحوه همگام سازی نمایه شما با منبع داده شما هنگامی که محتوای منبع داده شما تغییر می کند را نشان می دهد.
بررسی اجمالی راه حل
سه پیشرفت اصلی در مورد وجود دارد کانکتور Amazon Kendra S3 :
- پشتیبانی از VPC - اکنون اتصال دهنده با استفاده از شما پشتیبانی می کند ابر خصوصی مجازی آمازون شبکه های (Amazon VPC). اکنون می توانید به طور ایمن با استفاده از آمازون S3 متصل شوید نقاط پایانی VPC برای Amazon S3 با تعیین اتصال VPC، زیر شبکه و گروه های امنیتی.
- دو حالت همگام سازی – وقتی همگامسازی یک منبع داده در Amazon S3 را با فهرست آمازون کندرا برنامهریزی میکنید، اکنون میتوانید انتخاب کنید که در حالت همگامسازی کامل یا حالت همگامسازی سند جدید، اصلاح شده و حذف شده اجرا شود. در حالت همگامسازی کامل، هر بار که همگامسازی اجرا میشود، اشیاء را در هر پوشه در مسیر اصلی که برای خزیدن پیکربندی شده است اسکن میکند و همه اسناد را دوباره وارد میکند. به روز رسانی کامل به شما امکان می دهد بدون نیاز به حذف و ایجاد منبع داده جدید، فهرست را بازنشانی کنید. در حالت همگامسازی سند جدید، اصلاح شده و حذف شده، هر بار که کار همگامسازی اجرا میشود، فقط اشیایی را پردازش میکند که از آخرین خزیدن اضافه، اصلاح یا حذف شدهاند. خزیدن افزایشی می تواند زمان اجرا و هزینه را در صورت استفاده با مجموعه داده هایی که اشیاء جدید را به منابع داده موجود به طور منظم اضافه می کنند، کاهش دهد.
- الگوهای گنجاندن و حذف اضافی برای اسناد: علاوه بر پیشوندها، الگوهایی را برای گنجاندن یا حذف اسناد از فهرست شما معرفی می کنیم. دو نوع الگوی پشتیبانی شده، نوع گلوب یا فایل به سبک یونیکس هستند. اکنون می توانید یک الگوی عبارت منظم اضافه کنید تا پوشه های خاصی را شامل شود یا پوشه ها، انواع فایل ها یا فایل های خاص را از منبع داده خود حذف کنید. این می تواند برای مخازن داده های مشترک که حاوی محتوای متعلق به دسته ها، طبقه بندی و انواع فایل های مختلف است مفید باشد.
پیش نیازها
برای این راهنما، شما باید پیش نیازهای زیر را داشته باشید:
مخزن اسناد خود را ایجاد و پیکربندی کنید
قبل از اینکه بتوانید یک فهرست در آمازون کندرا ایجاد کنید، باید اسناد را در یک سطل S3 بارگیری کنید. این بخش حاوی دستورالعمل هایی برای ایجاد یک سطل S3، دریافت فایل ها و بارگذاری آنها در سطل است. پس از انجام تمام مراحل این بخش، یک منبع داده دارید که آمازون کندرا می تواند از آن استفاده کند.
- بر کنسول مدیریت AWS، در لیست منطقه، ایالات متحده شرقی (شمال ویرجینیا) یا هر منطقه ای را که انتخاب می کنید انتخاب کنید آمازون کندرا در دسترس است.
- را انتخاب کنید خدمات.
- تحت ذخیره سازی، انتخاب کنید S3.
- در کنسول آمازون S3، را انتخاب کنید سطل ایجاد کنید.
- تحت پیکربندی عمومی، اطلاعات زیر را ارائه دهید:
- برای نام سطل, را وارد کنید
kendrapost-{your account id}.
- برای منطقه، همان منطقه ای را انتخاب کنید که برای استقرار فهرست آمازون کندرا استفاده می کنید (این پست از آن استفاده می کند
us-east-1
). - تحت تنظیمات سطل، برای دسترسی عمومی را مسدود کنید، همه چیز را با مقادیر پیش فرض بگذارید.
- برای نام سطل, را وارد کنید
- تحت تنظیمات پیشرفته، همه چیز را با مقادیر پیش فرض بگذارید.
- را انتخاب کنید سطل ایجاد کنید.
- دانلود AWS_Whitepapers.zip و فایل ها را از حالت فشرده خارج کنید.
- در کنسول آمازون S3، سطلی را که به تازگی ایجاد کرده اید انتخاب کرده و انتخاب کنید بارگذاری.
- پوشه ها را آپلود کنید
Best Practices
,Databases
,General
وMachine Learning
از فایل زیپ نشده
در داخل سطل خود، اکنون باید چهار پوشه را ببینید.
یک منبع داده اضافه کنید
A منبع اطلاعات مکانی است که اسناد را برای نمایه سازی ذخیره می کند. می توانید منابع داده را به طور خودکار با فهرست آمازون کندرا همگام کنید تا مطمئن شوید که جستجوها به درستی اسناد جدید، به روز شده یا حذف شده را در مخازن منبع منعکس می کنند.
پس از انجام تمام مراحل در این بخش، یک منبع داده مرتبط با آمازون کندرا خواهید داشت. برای اطلاعات بیشتر ببین افزودن اسناد از منبع داده.
قبل از ادامه، مطمئن شوید که ایجاد ایندکس کامل شده است و نمایه به صورت نشان داده می شود فعال. برای اطلاعات بیشتر ببین ایجاد یک شاخص.
- در کنسول آمازون کندرا، به فهرست خود بروید (برای این پست،
kendra-blog-index
). - بر
kendra-blog-index
صفحه ، انتخاب کنید اضافه کردن منابع داده. - تحت آمازون S3، را انتخاب کنید افزودن کانکتور.
برای اطلاعات بیشتر در مورد منابع مختلف داده ای که Amazon Kendra پشتیبانی می کند، ببینید افزودن اسناد از منبع داده.
- در جزئیات منبع داده را مشخص کنید بخش، برای نام منبع داده، وارد
aws_white_paper
. - برای توضیحات:، وارد
AWS White Paper documentation
. - را انتخاب کنید بعدی.
حالا شما ایجاد می کنید هویت AWS و مدیریت دسترسی نقش (IAM) برای آمازون کندرا.
- در دسترسی و امنیت را تعریف کنید صفحه، برای نقش IAM بخش، را انتخاب کنید یک نقش جدید ایجاد کنید.
- برای نام نقش، وارد کنید
source-role
(نام نقش شما با پیشوند استAmazonKendra-
). - در VPC و امنیت را پیکربندی کنید بخش، خود را انتخاب کنید VPC، و وارد شوید زیرشبکه ها و گروه های امنیتی VPC.
برای اطلاعات بیشتر در مورد اتصال Amazon Kendra خود به Amazon Virtual Private Cloud، نگاه کنید پیکربندی آمازون کندرا برای استفاده از VPC.
- را انتخاب کنید بعدی.
- در تنظیمات همگام سازی را پیکربندی کنید صفحه، برای محل منبع داده را وارد کنید، سطل S3 را که ایجاد کردید وارد کنید:
kendrapost-{your account id}
. - ترک کردن محل پوشه پیشوند فایل های فراداده جای خالی.
بهطور پیشفرض، فایلهای ابرداده در همان دایرکتوری اسناد ذخیره میشوند. اگر می خواهید این فایل ها را در پوشه دیگری قرار دهید، می توانید یک پیشوند اضافه کنید. برای اطلاعات بیشتر ببین ابرداده سند آمازون S3.
- برای کلید رمزگشایی را انتخاب کنید، آن را از حالت انتخاب خارج کنید.
- برای پیکربندی اضافی، می توانید یک الگو برای گنجاندن یا حذف پوشه ها یا فایل های خاص اضافه کنید. برای این پست، مقادیر پیش فرض را حفظ کنید.
- برای حالت همگام سازی را انتخاب کنید همگام سازی اسناد جدید، اصلاح شده یا حذف شده.
- برای فرکانس، انتخاب کنید اجرا بر اساس تقاضا.
این مرحله فرکانس همگام سازی منبع داده با شاخص آمازون کندرا را مشخص می کند.
- را انتخاب کنید بعدی.
- در تنظیم نقشه های میدانی صفحه، مقادیر پیش فرض را حفظ کنید.
- را انتخاب کنید بعدی.
- بر بررسی و ایجاد کنید صفحه ، انتخاب کنید منبع داده را اضافه کنید.
- به نمایه Kendra خود برگردید.
- خود را انتخاب منبع اطلاعات، پس از آن را انتخاب کنید اکنون همگام سازی کنید برای همگام سازی اسناد با نمایه آمازون کندرا.
مدت زمان این فرآیند به تعداد اسنادی که فهرست بندی می کنید بستگی دارد. برای این مورد، ممکن است 15 دقیقه طول بکشد، پس از آن باید پیامی مبنی بر موفقیت آمیز بودن همگام سازی مشاهده کنید. در قسمت Sync run history می بینید که 40 سند همگام شده اند.
نمایه آمازون کندرا شما اکنون برای سوالات زبان طبیعی آماده است. وقتی فهرست خود را جستجو میکنید، آمازون کندرا از تمام دادهها و ابردادههای ارائهشده برای بازگرداندن دقیقترین پاسخها به درخواست جستجوی شما استفاده میکند. در کنسول آمازون کندرا، انتخاب کنید محتوای نمایه شده را جستجو کنید. در قسمت پرس و جو، با یک پرس و جو شروع کنید مانند "کدام سرویس AWS دارای 11 نه دوام است؟"
برای اطلاعات بیشتر در مورد پرس و جو از نمایه، رجوع کنید به پرس و جو از یک شاخص
همگام سازی تغییرات منبع داده برای جستجوی فهرست
منبع داده شما برای همگام سازی هر گونه داده جدید، اصلاح شده یا حذف شده تنظیم شده است. قبل از اینکه بتوانید منبع داده خود را به صورت تدریجی با یک فهرست در آمازون کندرا همگام کنید، باید اسناد جدید را در یک سطل S3 بارگیری کنید.
- در کنسول آمازون S3، سطلی را که به تازگی ایجاد کرده اید انتخاب کرده و انتخاب کنید بارگذاری.
- پوشه ها را آپلود کنید
Security
وWell_Architected
از فایل زیپ نشده
اکنون می توانید اسناد جدید اضافه شده به سطل S3 را همگام سازی کنید:
- در کنسول آمازون کندرا، انتخاب کنید منابع داده و سپس منبع داده S3 خود را انتخاب کنید.
- را انتخاب کنید همگام سازی اکنون
مدت زمان این فرآیند به تعداد اسنادی که فهرست بندی می کنید بستگی دارد. برای این مورد، ممکن است 15 دقیقه طول بکشد، پس از آن باید پیامی مبنی بر موفقیت آمیز بودن همگام سازی مشاهده کنید.
در همگام سازی تاریخچه اجرا بخش، می توانید ببینید که 20 سند همگام شده اند.
منبع داده را دوباره فهرست کنید
در سناریویی که منبع داده دارای اطلاعات قدیمی است، اکنون می توانید منبع داده را مجدداً فهرست کنید بدون اینکه نیازی به حذف و ایجاد یک منبع داده جدید باشد. برای تغییر حالت همگام سازی و فهرست مجدد منبع داده، مراحل زیر را انجام دهید:
- در کنسول آمازون کندرا، انتخاب کنید منابع داده و سپس منبع داده S3 خود را انتخاب کنید.
- بر اعمال منو ، انتخاب کنید ویرایش کنید.
- را انتخاب کنید بعدی حرکت به سوی مرحله 3 - صفحه تنظیمات همگام سازی را پیکربندی کنید.
- برای حالت همگام سازی، را انتخاب کنید همگام سازی کامل
- برای فرکانس، انتخاب کنید اجرا بر اساس تقاضا.
- را انتخاب کنید بعدی.
- در تنظیم نقشه های میدانی صفحه، مقادیر پیش فرض را حفظ کنید.
- را انتخاب کنید بعدی.
- بر بررسی و ایجاد کنید صفحه ، انتخاب کنید بروزرسانی.
اکنون می توانید اسناد جدید اضافه شده به سطل S3 را همگام سازی کنید.
- در کنسول آمازون کندرا، انتخاب کنید منابع داده و سپس منبع داده S3 خود را انتخاب کنید.
- را انتخاب کنید همگام سازی اکنون
در همگام سازی تاریخچه اجرا بخش، می توانید ببینید که همه اسناد بدون توجه به وضعیت همگام سازی قبلی در زیر ستون اصلاح شده همگام شده اند.
پاک کردن
برای جلوگیری از تحمیل هزینههای آتی و پاکسازی نقشها و خطمشیهای استفاده نشده، منابعی را که ایجاد کردهاید حذف کنید:
- در نمایه آمازون کندرا، انتخاب کنید شاخص در صفحه ناوبری
- ایندکسی که ایجاد کردید را انتخاب کنید و روی اعمال منو ، انتخاب کنید حذف.
- برای تایید حذف، وقتی از شما خواسته شد Delete را وارد کرده و انتخاب کنید حذف.
صبر کنید تا پیام تایید را دریافت کنید؛ این فرآیند می تواند تا 15 دقیقه طول بکشد.
- در کنسول آمازون S3، سطل S3 را حذف کنید.
- در کنسول IAM، نقش های IAM مربوطه را حذف کنید.
نتیجه
در این پست، نحوه استفاده از آمازون کندرا را برای استقرار یک سرویس جستجوی سازمانی با استفاده از اتصال ایمن به آمازون S3 که به دروازه اینترنتی یا دستگاه ترجمه آدرس شبکه (NAT) نیاز ندارد، یاد گرفتید. میتوانید با استفاده از حالت همگامسازی، همگامسازی سریعتر اسناد خود را فعال کنید.
بسیاری از ویژگی های اضافی وجود دارد که ما آنها را پوشش ندادیم. مثلا:
- میتوانید کنترل دسترسی مبتنی بر کاربر را برای فهرست آمازون Kendra خود فعال کنید و دسترسی به اسناد را بر اساس کنترلهای دسترسی که قبلاً پیکربندی کردهاید محدود کنید.
- میتوانید ویژگیهای شی را به ویژگیهای فهرست آمازون کندرا نگاشت کنید، و آنها را برای صفحهبندی، جستجو و نمایش در نتایج جستجو فعال کنید.
- با استفاده از جستجوی جدولی Amazon Kendra می توانید به سرعت اطلاعات صفحات وب (جدول HTML) را پیدا کنید
برای کسب اطلاعات بیشتر در مورد آمازون کندرا، مراجعه کنید راهنمای توسعه دهنده آمازون کندرا.
درباره نویسنده
ماران چندرسکاران یک معمار ارشد راه حل در خدمات وب آمازون است که با مشتریان سازمانی ما کار می کند. خارج از محل کار، او عاشق سفر است.
آرجون آگراوال مهندس نرم افزار در AWS است و در حال حاضر با تیم آمازون کندرا در یک موتور جستجوی سازمانی کار می کند. او مشتاق فن آوری جدید و حل مشکلات دنیای واقعی است. خارج از محل کار، او عاشق پیاده روی و سفر است.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- درباره ما
- دسترسی
- در دسترس
- حساب
- دقیق
- به درستی
- در میان
- اضافه
- اضافه
- اضافی
- نشانی
- پس از
- الگوریتم
- معرفی
- اجازه می دهد تا
- قبلا
- آمازون
- آمازون کندرا
- آمازون RDS
- آمازون خدمات وب
- و
- پاسخ
- برنامه های کاربردی
- مرتبط است
- خواص
- بطور خودکار
- در دسترس
- اجتناب از
- AWS
- به عقب
- مستقر
- اساس
- قبل از
- قابلیت های
- مورد
- موارد
- دسته
- معین
- تبادل
- بار
- انتخاب
- را انتخاب کنید
- طبقه بندی
- ابر
- ستون
- کامل
- تکمیل
- تکرار
- اتصال
- اتصال
- ارتباط
- کنسول
- شامل
- محتوا
- زمینه
- مداوم
- کنترل
- گروه شاهد
- به درستی
- متناظر
- هزینه
- پوشش
- ایجاد
- ایجاد شده
- ایجاد
- در حال حاضر
- مشتریان
- داده ها
- پایگاه داده
- پایگاه های داده
- مجموعه داده ها
- به طور پیش فرض
- تعریف می کند
- نشان می دهد
- بستگی دارد
- گسترش
- توصیف
- توسعه دهنده
- دستگاه
- مختلف
- نمایش دادن
- سند
- اسناد و مدارک
- نمی کند
- راندن
- دوام
- شرق
- آسان برای استفاده
- قادر ساختن
- را قادر می سازد
- موتور
- مهندس
- وارد
- سرمایه گذاری
- مشتریان سازمانی
- جستجوی سازمانی
- اتر (ETH)
- هر
- همه چیز
- مثال
- موجود
- امکانات
- رشته
- پرونده
- فایل ها
- پیدا کردن
- پیروی
- فرکانس
- از جانب
- کامل
- آینده
- دروازه
- دریافت کنید
- گوگل
- گروه ها
- داشتن
- کمک
- پیاده روی
- تاریخ
- چگونه
- چگونه
- اما
- HTML
- HTTPS
- IAM
- هویت
- ارتقاء
- in
- شامل
- گنجاندن
- شاخص
- اطلاعات
- دستورالعمل
- ادغام
- هوشمند
- اینترنت
- معرفی
- قطع نظر از
- IT
- کار
- نگاه داشتن
- زبان
- نام
- یاد گرفتن
- آموخته
- یادگیری
- ترک کردن
- مرتبط
- فهرست
- بار
- محل
- دستگاه
- فراگیری ماشین
- اصلی
- ساخت
- مدیریت
- بسیاری
- نقشه
- فهرست
- پیام
- متاداده
- دقیقه
- ML
- حالت
- حالت های
- اصلاح شده
- تغییر
- بیش
- اکثر
- حرکت
- چندگانه
- نام
- طبیعی
- زبان طبیعی
- هدایت
- جهت یابی
- نیاز
- شبکه
- شبکه
- جدید
- عدد
- هدف
- اشیاء
- OneDrive
- خارج از
- خود
- قطعه
- مقاله
- احساساتی
- مسیر
- الگو
- الگوهای
- محل
- افلاطون
- هوش داده افلاطون
- PlatoData
- سیاست
- پست
- پیش نیازها
- قبلی
- خصوصی
- مشکلات
- روند
- فرآیندهای
- ارائه
- ارائه
- فراهم می کند
- عمومی
- سوالات
- سریعتر
- به سرعت
- رسیدن به
- اماده
- دنیای واقعی
- كاهش دادن
- بازتاب
- منطقه
- منظم
- مربوط
- نیاز
- منابع
- محدود کردن
- نتایج
- برگشت
- نقش
- نقش
- ریشه
- دویدن
- در حال اجرا
- salesforce
- همان
- سناریو
- برنامه
- جستجو
- موتور جستجو
- بخش
- امن
- ایمن
- تیم امنیت لاتاری
- ارشد
- سرویس
- خدمات
- تنظیم
- تنظیمات
- به اشتراک گذاشته شده
- نقطه اشتراک
- باید
- نشان می دهد
- ساده
- پس از
- So
- نرم افزار
- مهندس نرمافزار
- مزایا
- حل کردن
- برخی از
- منبع
- منابع
- خاص
- شروع
- وضعیت
- گام
- مراحل
- ذخیره سازی
- ذخیره شده
- پرده
- سبک
- زیر شبکه
- زیرشبکه ها
- موفق
- چنین
- پشتیبانی
- پشتیبانی
- پشتیبانی از
- هماهنگ سازی
- گرفتن
- تیم
- پیشرفته
- La
- منبع
- شان
- سه
- زمان
- به
- ترجمه
- سفر
- انواع
- زیر
- فهمیدن
- یونیکس
- استفاده نشده
- به روز شده
- us
- استفاده کنید
- مورد استفاده
- کاربران
- ارزشها
- ویرجینیا
- مجازی
- خرید
- وب
- خدمات وب
- که
- سفید
- کتاب سفید
- در داخل
- بدون
- مهاجرت کاری
- کارگر
- شما
- زفیرنت
- زیپ