アマゾンケンドラ は、機械学習 (ML) を活用した、高精度で使いやすいインテリジェント検索サービスです。 Amazon Kendra は、データ ソース コネクタのスイートを提供し、コンテンツがどこにあっても、コンテンツの取り込みとインデックス作成のプロセスを簡素化します。
組織内の貴重なデータは、構造化リポジトリと非構造化リポジトリの両方に保存されます。 Amazon Kendra は、複数の構造化および非構造化ナレッジベース リポジトリにまたがるデータを収集し、インデックス付けおよび検索を行うことができます。
そのようなナレッジベース リポジトリの 2.0 つが Microsoft SharePoint です。Amazon Kendra 用の SharePoint コネクタを更新してさらに多くの機能を追加したことを発表できることをうれしく思います。 この新しいバージョン (VXNUMX) では、SharePoint サブスクリプション エディションのサポートと、新規、変更、または削除されたコンテンツに基づいてコンテンツにインデックスを付けるための複数の認証および同期モードのサポートが追加されました。
SharePoint Online での認証に OAuth 2.0 を選択できるようになりました。 データ ソースのコンテンツが変更されたときにインデックスを更新するために、複数の同期オプションを使用できます。 ユーザーおよびグループの情報に基づいて検索結果をフィルタリングして、ユーザーのアクセス権に基づいてのみ検索結果が表示されるようにすることができます。
この投稿では、Amazon Kendra SharePoint コネクタ V2.0 を使用して SharePoint のコンテンツにインデックスを付ける方法を示します。
ソリューションの概要
Amazon Kendra を中心的な場所として使用し、さまざまなデータソースによって提供されるコンテンツのインデックスを作成し、インテリジェントな検索を行うことができます。 次のセクションでは、インデックスの作成、SharePoint コネクタの追加、ソリューションのテストの手順を説明します。
前提条件
開始するには、次のものが必要です。
Amazon Kendra インデックスを作成する
Amazon Kendra インデックスを作成するには、次の手順を実行します。
- Amazon Kendraコンソールで、 インデックスを作成する.
- インデックス名、インデックスの名前を入力します (たとえば、
my-sharepoint-index
). - オプションの説明を入力します。
- 選択する 新しい役割を作成する.
- ロール名、IAM ロール名を入力します。
- オプションの暗号化設定とタグを構成します。
- 選択する Next.
- アクセス制御設定、選択する はい.
- トークン構成、セット トークンタイプ 〜へ JSONの デフォルト値のままにしておきます および グループ.
- ユーザーグループの拡張、デフォルトのままにします。
- 選択する Next.
- プロビジョニングを指定する選択 開発者版、概念実証と実験の構築に適しており、選択します。 創造する.
SharePoint データソースを Amazon Kendra インデックスに追加する
Amazon Kendra を実装する利点の XNUMX つは、次のようなデータ ソースに事前に構築されたコネクタのセットを使用できることです。 Amazon シンプル ストレージ サービス (Amazon S3)、 Amazon リレーショナル データベース サービス (Amazon RDS)、SharePoint Online、Salesforce。
SharePoint データ ソースをインデックスに追加するには、次の手順を実行します。
- Amazon Kendra コンソールで、作成したインデックスに移動します。
- 選択する データソース ナビゲーションペインに表示されます。
- SharePoint コネクタ V2.0、選択する コネクタを追加.
- データソース名、名前を入力します(たとえば、
my-sharepoint-data-source
). - オプションの説明を入力します。
- 選択する 英語(en) for 既定の言語.
- オプションのタグを入力します。
- 選択する Next.
SharePoint アプリケーションが使用しているホスティング オプションに応じて、適切なホスティング方法を選択します。 選択したホスティング方法に基づいて、コネクタ構成に必要な属性が表示されます。
- 選択した場合 SharePoint Online、次の手順を実行します。
- SharePoint Online リポジトリの URL を入力します。
- 認証オプションを選択します (これらの認証の詳細は、SharePoint アプリケーションと統合するために SharePoint コネクタによって使用されます)。
- SharePoint Online アプリケーションのテナント ID を入力します。
- AWSシークレットマネージャーシークレット、SharePoint Online アプリケーション資格情報を持つシークレットを選択するか、新しいシークレットを作成して接続の詳細を追加します (例:
AmazonKendra-SharePoint-my-sharepoint-online-secret
).
の詳細については AWS シークレットマネージャー、 参照する Secrets Manager の使用を開始する.
SharePoint コネクタは、 clientId
, clientSecret
, userName
, password
SharePoint Online アプリケーションで認証するための情報。 これらの詳細には、 アプリの登録 SharePoint Online アプリケーションがすでに登録されている場合は、Azure portal のページにアクセスします。
- 選択した場合 SharePointServer、次の手順を実行します。
- SharePoint のバージョンを選択します (たとえば、この投稿では SharePoint 2019 を使用します)。
- SharePoint Server リポジトリのサイト URL を入力します。
- SSL証明書の場所、SharePoint Server SSL 証明書が存在する S3 バケット ファイルへのパスを入力します。
- SharePoint サーバーにプロキシ接続が必要な場合は、Web プロキシのホスト名とポート番号の詳細を入力します。
この例で使用されている SharePoint アプリケーションは公開アプリケーションであるため、この投稿では Web プロキシは使用されません。
-
- アクセス制御リスト (ACL) 構成の認証オプションを選択します。
これらの認証の詳細は、SharePoint インスタンスと統合するために SharePoint コネクタによって使用されます。
- AWSシークレットマネージャーシークレット、SharePoint Server 資格情報を持つシークレットを選択するか、新しいシークレットを作成して接続の詳細を追加します (例:
AmazonKendra-my-sharepoint-server-secret
).
SharePoint コネクタは、ユーザー名とパスワードの情報を使用して SharePoint Server アプリケーションで認証します。 ACL 設定としてドメイン フォーム IDP を持つ電子メール ID を使用する場合は、LDAP サーバー エンドポイント、検索ベース、LDAP ユーザー名、および LDAP パスワードも必要です。
検索可能および表示可能なコンテンツに対するきめ細かい制御を実現するために、SharePoint コネクタ V2.0 には ID クローラー機能が導入されています。
- ID クローラーを有効にして選択します。 クロールローカルグループマッピング および クロール AD グループのマッピング.
- 仮想プライベートクラウド(VPC)、SharePoint コネクタから SharePoint アプリケーションにアクセスできる VPC を選択します。
この投稿では、 VPCなし この例で使用されている SharePoint アプリケーションは、 アマゾン エラスティック コンピューティング クラウド (Amazon EC2)インスタンス。
- 選んだ 新しい役割を作成する(推奨) などのロール名を指定します。
AmazonKendra-sharepoint-v2
. - 選択する Next.
- インデックス作成に含めるエンティティを選択します。 選んでいいですよ すべて または、ユースケースに基づいた特定のエンティティ。 この投稿では、 すべて.
正規表現を使用してドキュメントを含めたり除外したりすることもできます。 Amazon Kendra がインデックス作成から特定のドキュメントを除外するか、そのパターンを持つドキュメントのみを含めるために使用するパターンを定義できます。 詳細については、以下を参照してください。 SharePointの構成.
- データ ソースのコンテンツが変更されたときにインデックスを更新するには、同期モードを選択します。
を選択すると、以前の同期プロセスに関係なく、すべてのエンティティのすべてのコンテンツを同期してインデックスを付けることができます。 完全同期、または新しいコンテンツ、変更されたコンテンツ、または削除されたコンテンツのみを同期するか、新しいコンテンツまたは変更されたコンテンツのみを同期します。 この投稿では、 完全同期.
- 同期スケジュールを実行する頻度を選択します。 オンデマンドで実行.
- 選択する Next.
この次のステップでは、フィールド マッピングを作成して、メタデータの追加レイヤーをドキュメントに追加できます。 これにより、精度を向上させることができます。 手動チューニング, フィルタリング、ファセット加工。
- デフォルトのフィールドマッピング情報を確認し、選択します。 Next.
- 最後のステップとして、構成の詳細を確認して、 データソースを追加する Amazon Kendra インデックスの SharePoint コネクタ データ ソースを作成します。
ソリューションをテストする
これで、SharePoint コネクタを使用して Amazon Kendra 検索機能を準備し、テストする準備が整いました。
この投稿では、AWS 入門ドキュメントが SharePoint データ ソースに追加されます。 この投稿で使用したサンプル データセットは、次からダウンロードできます。 AWS_ホワイトペーパー.zip。 このデータセットには、ドキュメントの種類 (AWS データベース オプション、セキュリティ、ML に関連するドキュメントなど) に基づいて複数のディレクトリに分類された PDF ドキュメントが含まれています。
また、SharePoint のサンプル データセット ディレクトリはユーザーの電子メール ID とグループの詳細で構成されているため、権限を持つユーザーとグループのみが特定のディレクトリまたは個々のファイルにアクセスできます。
検索結果に対する詳細レベルの制御を実現するために、ローカルおよび AD グループ マッピング オプションが選択されて ID クローラーが有効になっている場合、SharePoint コネクタはコンテンツに加えて、SharePoint データ ソース内のローカルまたは Active Directory (AD) グループ マッピングをクロールします。 。 この機能により、Amazon Kendra のインデックス付きコンテンツは、ユーザーおよびグループのアクセス制御権限に基づいて検索および表示可能になります。
インデックスを SharePoint コンテンツと同期するには、次の手順を実行します。
- Amazon Kendra コンソールで、作成したインデックスに移動します。
- 選択する データソース ナビゲーション ペインで SharePoint データ ソースを選択します。
- 選択する 今すぐ同期 SharePoint アプリケーションからコンテンツのインデックスを作成するプロセスを開始し、プロセスが完了するまで待ちます。
同期の問題が発生した場合は、次を参照してください。 データソースのトラブルシューティング 。
同期プロセスが成功すると、 最終同期ステータス に設定されます 成功 – サービスは正常に動作しています。 これで、SharePoint アプリケーションのコンテンツにインデックスが付けられ、クエリの準備が整いました。
- 選択する インデックス付きコンテンツを検索 (下 データ管理) ナビゲーション ウィンドウに表示されます。
- 検索フィールドにテスト クエリを入力して、 を押します。 入力します.
「S3 の耐久性はどれくらいですか?」などのテスト クエリでは、次の Amazon Kendra が提案する回答を提供します。 このクエリの結果は、インデックス付けされたすべてのコンテンツから得られることに注意してください。 これは、このクエリにはユーザー名またはグループ情報のコンテキストが存在しないためです。
- アクセス制御された検索をテストするには、展開します。 ユーザー名またはグループを使用してクエリをテストする 選択して ユーザー名またはグループを適用する ユーザー名(メールID)またはグループ情報を追加します。
Experience Builder アプリを使用する場合、アプリにはユーザー コンテキストが含まれるため、ユーザー ID またはグループ ID を明示的に追加する必要はありません。
- この投稿では、SharePoint サイトのデータベース ディレクトリへのアクセスは、データベース スペシャリスト グループのみに提供されます。
- 新しいテスト クエリを入力し、 を押します 入力します.
この例では、Databases ディレクトリ内のコンテンツのみが検索され、結果が表示されます。 これは、データベース スペシャリスト グループがデータベース ディレクトリにのみアクセスできるためです。
おめでとう! Amazon Kendra を使用して、SharePoint アプリケーションからインデックス付けされたコンテンツに基づいて回答と洞察を明らかにすることに成功しました。
Amazon Kendra エクスペリエンスビルダー
フロントエンドコードを必要とせずに、Amazon Kendra 検索アプリケーションを構築してデプロイできます。 Amazon Kendra Experience Builder を使用すると、数回クリックするだけで完全に機能する検索アプリケーションを構築してデプロイできるため、すぐに検索を開始できます。
参照する コードなしで検索エクスペリエンスを構築 。
クリーンアップ
将来のコストの発生を避けるために、このソリューションの一部として作成したリソースをクリーンアップしてください。 このソリューションのテスト中に新しい Amazon Kendra インデックスを作成した場合、不要になった場合は削除してください。 SharePoint 用 Amazon Kendra コネクタを使用して新しいデータ ソースを追加しただけの場合は、ソリューションのレビューが完了した後にそのデータ ソースを削除します。
参照する インデックスとデータ ソースの削除 。
まとめ
この投稿では、SharePoint アプリケーションから Amazon Kendra インデックスにドキュメントを取り込む方法を説明しました。 また、SharePoint コネクタの新しいバージョンで導入されたいくつかの新機能も確認しました。
SharePoint 用 Amazon Kendra コネクタの詳細については、以下を参照してください。 Microsoft SharePoint コネクタ V2.0.
最後に、忘れずにチェックしてください。 Amazonケンドラに関する他のブログ投稿!
著者について
ウダヤ・ジャラディ アマゾン ウェブ サービス (AWS) のソリューション アーキテクトであり、独立系ソフトウェア ベンダー (ISV) の顧客の支援を専門としています。 クラウド戦略、AI/ML テクノロジー、および運用の専門知識を持つ Udaya は、経営陣やエンジニアの信頼できるアドバイザーとして機能し、クラウドの可能性を最大化し、革新的な製品開発を推進するための個別のガイダンスを提供します。 Udaya は、さまざまなビジネス ドメインにわたるエンタープライズ アーキテクト (EA) としての経歴を活用し、ISV 顧客の特定のニーズを満たすように調整されたスケーラブルなクラウド ソリューションの構築に優れています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- プラトアイストリーム。 Web3 データ インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- 未来を鋳造する w エイドリエン・アシュリー。 こちらからアクセスしてください。
- PREIPO® を使用して PRE-IPO 企業の株式を売買します。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-sharepoint-connector-v2-0-for-amazon-kendra/
- :持っている
- :は
- :どこ
- $UP
- 10
- 100
- 11
- 12
- 14
- 17
- 20
- 2019
- 7
- 9
- a
- 私たちについて
- アクセス
- アクセス
- 精度
- 正確な
- 達成する
- 越えて
- アクティブ
- Active Directory
- Ad
- 加えます
- 追加されました
- 添加
- 利点
- 顧問
- 後
- AI / ML
- すべて
- 既に
- また
- Amazon
- Amazon EC2
- アマゾンケンドラ
- アマゾンRDS
- Amazon Webサービス
- Amazon Webサービス(AWS)
- an
- および
- アナウンス
- 発表
- 回答
- どれか
- アプリ
- 現れる
- 申し込み
- 適切な
- です
- AS
- At
- 属性
- 認証
- 認証
- 承認
- 利用できます
- 避ける
- 離れて
- AWS
- Azure
- 背景
- ベース
- ベース
- BE
- なぜなら
- ブログ
- ブログの投稿
- 両言語で
- ビルド
- ビルダー
- 建物
- ビジネス
- by
- 缶
- 機能
- 場合
- 中央の
- 一定
- 証明書
- 変更
- チェック
- 選択する
- クラウド
- コード
- コンプリート
- 記入済みの
- 計算
- コンセプト
- 接続
- 領事
- コンテンツ
- 中身
- コンテキスト
- コントロール
- コスト
- クローラー
- 作ります
- 作成した
- Credentials
- Customers
- データ
- データベース
- データベースを追加しました
- デフォルト
- デフォルト
- 実証します
- 展開します
- 展開
- 説明
- 細部
- 開発
- ディレクトリ
- 異なる
- ドキュメント
- ドメイン
- ドメイン
- ドント
- 運転
- 耐久性
- EA
- エディション
- どちら
- 使用可能
- 可能
- 出会い
- 暗号化
- エンドポイント
- エンジニア
- 確保
- 入力します
- Enterprise
- エンティティ
- エーテル(ETH)
- さらに
- 例
- 興奮した
- 幹部
- 詳細
- 体験
- 専門知識
- 表現
- 余分な
- 特徴
- 少数の
- フィールド
- File
- filter
- フォロー中
- フォーム
- 周波数
- から
- 完全に
- 機能的な
- 機能性
- 未来
- 取得する
- 受け
- Go
- グループ
- グループの
- ガイダンス
- 持ってる
- ことができます
- 非常に
- 彼の
- host
- ホスティング
- 認定条件
- How To
- HTML
- HTTP
- HTTPS
- IAM
- ID
- アイデンティティ
- イド
- if
- 実装
- 改善します
- in
- include
- 含ま
- 独立しました
- index
- 個人
- 情報
- 革新的な
- 洞察
- 統合する
- インテリジェント-
- に
- 導入
- 問題
- IT
- JPG
- 知識
- 姓
- 層
- LDAP
- LEARN
- 学習
- コメントを残す
- レベル
- 活用
- ような
- リスト
- ローカル
- 位置して
- 場所
- より長いです
- 機械
- 機械学習
- マネージャー
- マッピング
- 最大化
- 大会
- 方法
- Microsoft
- ML
- モード
- モード
- 修正されました
- 他には?
- の試合に
- 名
- ナビゲート
- ナビゲーション
- 必要
- ニーズ
- 新作
- 新しい特徴
- 次の
- いいえ
- 注意
- 今
- 数
- オース
- of
- 提供すること
- オファー
- on
- オンライン
- の
- オペレーティング
- 業務執行統括
- オプション
- オプション
- or
- 組織
- 私たちの
- でる
- が
- ページ
- ペイン
- 部
- パスワード
- path
- パターン
- パターン
- パーミッション
- カスタマイズ
- 選ぶ
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポータル
- ポスト
- 投稿
- 潜在的な
- パワード
- 準備
- 前
- プライベート
- プロセス
- プロダクト
- 製品開発
- 証明
- 概念実証
- 提供します
- 提供
- は、大阪で
- 代理
- クエリ
- 準備
- 推奨される
- 関係なく
- 登録された
- レギュラー
- 関連する
- 倉庫
- の提出が必要です
- 必要
- リソース
- 結果
- レビュー
- 日
- 右
- 権利
- 職種
- ラン
- salesforce
- サンプル データセット
- ド電源のデ
- スケジュール
- を検索
- 検索
- 秘密
- セクション
- セキュリティ
- 選択
- 選択
- 仕える
- サービス
- サービス
- セッションに
- 設定
- 設定
- いくつかの
- SharePointの
- 示されました
- 示す
- 簡単な拡張で
- 簡素化する
- ウェブサイト
- So
- ソフトウェア
- 溶液
- ソリューション
- 一部
- ソース
- ソース
- 特化
- 特定の
- SSL
- SSL証明書
- start
- 開始
- Status:
- 手順
- ステップ
- ストレージ利用料
- 保存され
- 作戦
- 構造化された
- 購読
- 成功した
- 首尾よく
- そのような
- スイート
- サポート
- 表面
- 同期
- テーラード
- テクノロジー
- テナント
- test
- テスト
- それ
- そこ。
- したがって、
- ボーマン
- この
- 介して
- 〜へ
- 一緒に
- 信頼されている
- type
- 下
- アップデイト
- 更新しました
- URL
- つかいます
- 使用事例
- 中古
- ユーザー
- ユーザ名
- users
- 値
- 価値観
- さまざまな
- ベンダー
- バージョン
- wait
- we
- ウェブ
- Webサービス
- いつ
- which
- while
- 意志
- 無し
- ワークショップ
- でしょう
- 貴社
- あなたの
- ゼファーネット
- 〒