许多组织使用 Gmail的 满足他们的商务电子邮件需求。 Gmail 企业版是 谷歌工作区,它提供了一组生产力和协作工具,例如 Google Drive, 谷歌文档, Google表格, 和更多。 对于任何组织而言,电子邮件都包含大量信息,这些信息可能位于电子邮件的主题、消息内容甚至电子邮件附件中。 对与同事的电子邮件交互进行智能搜索可以帮助找到问题的答案,从而提高员工的工作效率并增强组织的整体客户体验。
亚马逊肯德拉 是一种高度准确和智能的搜索服务,允许您的用户使用自然语言处理 (NLP) 和高级搜索算法搜索非结构化和结构化数据。 您现在可以使用适用于 Amazon Kendra 的 Gmail 连接器为 Gmail 中的电子邮件和电子邮件附件编制索引,并使用由机器学习 (ML) 提供支持的 Amazon Kendra 中的智能搜索来搜索有关此内容的问题的答案。
这篇博文将引导您完成为贵组织的 Google Workspace 配置适用于 Amazon Kendra 的 Gmail 连接器的过程,使您能够根据定义的范围为电子邮件编制索引并利用 Amazon Kendra 的智能搜索功能。
解决方案概述
A 数据源 是 Amazon Kendra 连接到并为您的文档或内容编制索引的数据存储库或位置。 创建 Amazon Kendra 索引后,您可以创建一个或多个数据源并将它们配置为开始从数据源提取文档。 在我们的解决方案中,我们通过配置新的 Gmail 数据源连接器来过滤满足特定过滤条件的电子邮件,从而从 Gmail 中提取电子邮件和附件。 配置完成后,我们可以同步数据源对文档进行索引,让您可以对Amazon Kendra索引进行智能搜索。
先决条件
要为 Amazon Kendra 启用 Gmail 连接器,您需要具备以下条件:
- An AWS账户
- 一个 Google Workspace 帐号和您企业的一个组织,其中有一个或多个有权访问 Gmail 的用户
- Google Workspace 和 Google Cloud 控制台的管理员帐号凭据
配置 Google Workspace
要使 Amazon Kendra 能够访问和索引来自组织内 Gmail 账户的电子邮件并对它们执行智能搜索,必须配置您组织的 Google Workspace。 在接下来的步骤中,我们创建一个 服务帐号 Gmail 连接器用于索引电子邮件的。 提供服务帐户 授权范围 允许访问某些 Gmail API。 授权范围表示您请求用户为您的应用授权的权限,适用于您组织的 Google Workspace 中的所有电子邮件。
- 登录到您的组织的 谷歌云账户.
- 使用适当的名称创建一个新项目并将其分配给您的组织。 在我们的示例中,我们将项目命名为
KendraGmailConnector
. - 创建.
- 监控新项目的创建进度 通知 Google Cloud 控制台右上角的菜单。
- 创建项目后,选择选项菜单,选择 应用程式与服务¸ 并选择 自学资料库 查看 API 库。
- 在 API 库中,搜索
Admin SDK API
并选择 启用. Admin SDK API 支持管理 Google Workspace 帐号资源和审核使用情况。
- 同样,搜索
Gmail API
在 API 库页面上并选择 启用. Gmail API 可以帮助查看和管理 Gmail 邮箱数据,例如主题、消息和标签。
我们现在创建一个服务账户,Amazon Kendra 的 Gmail 连接器使用该账户根据允许的 API 范围访问您组织的电子邮件。
- 在选项菜单上,选择 IAM 和管理员,然后选择 服务帐号.
- 创建服务帐号.
- 输入您的服务帐户的名称。 对于这篇文章,我们将我们的服务帐户命名为
AmazonKendraGmailConnector
. - 输入您的服务帐户 ID 和帐户描述。
- 跳过可选步骤 授予此服务帐号访问项目的权限 和 授予用户访问此服务帐户的权限 并选择 完成 .
- 选择您创建的服务帐户以打开服务帐户详细信息页面。
- 记下服务帐户的唯一 ID(也称为客户端 ID),以在后续步骤中使用。
接下来,我们为服务帐户创建密钥,以供 Amazon Kendra 的 Gmail 连接器使用。
- 点击 Keys 标签,选择 新增金钥.
- 针对 钥匙类型, 选择 JSON.
- 创建.
此步骤将私钥下载到您的计算机,必须妥善保管以允许在 Amazon Kendra 控制台上进行配置。
- 关闭.
以下屏幕截图显示了凭据 JSON 文件的示例。
- 点击 更多信息 标签,展开 高级设置 部分。
- 下 全域授权,选择 查看 Google Workspace 管理控制台.
通过对您组织的数据进行域范围的授权来授予对服务帐号的访问权限必须谨慎,并且可以通过禁用或删除服务帐号或通过 Google Workspace 管理控制台删除访问权限来撤消。
- 使用您的 Google Workspace 管理员凭据登录管理控制台。
- 在导航窗格中, 安保行业,选择 访问和数据控制,然后选择 API 控件.
- 在 全域授权 部分中,选择 管理全域委派.
- 添加新的.
这带来了 添加新的客户端 ID 对话。
- 输入您之前创建的服务帐户的唯一 ID,并输入以下范围以允许服务帐户访问来自 Gmail 的电子邮件:
https://www.googleapis.com/auth/gmail.readonly
https://www.googleapis.com/auth/admin.directory.user.readonly
- 授权.
Google Cloud 控制台和 Google Workspace 管理控制台中的配置到此结束。
为 Amazon Kendra 配置 Gmail 连接器
在本节中,我们将介绍 Amazon Kendra 的 Gmail 连接器的配置步骤:
- 在 Amazon Kendra 控制台上, 创建一个新索引 或打开现有索引。 对于这篇文章,我们使用现有索引
EnterpriseKendraIndex
.
- 下 数据管理 在导航窗格中,选择 资料来源.
- 添加数据源.
- 在数据源列表中,找到 Gmail 连接器并选择 添加连接器.
- 点击 指定数据源详细信息 页面,完成以下步骤:
- 针对 资料来源名称,输入名称。
- 针对 课程描述,输入可选说明。
- 将语言保留为默认设置, 英语 (en).
Amazon Kendra 支持一组具有完整语义搜索的精选语言。 这些语言包括 西班牙语、日语、法语等。 有关更多信息,请参阅 添加非英语的文档.
- 将任何标签添加到索引,然后选择 下一页.
接下来,我们创建一个 AWS机密管理器 secret 来存储 Gmail 身份验证详细信息,并使用我们之前下载的凭据 JSON 文件中的值。
- 点击 定义访问和安全性 页面,完成以下步骤:
-
- 在 认证 部分中,选择 创建并添加新的秘密, 它打开了 创建 AWS Secrets Manager 密钥 对话。
- 针对 秘密名称,输入名称。
- 针对 客户邮箱,输入凭证 JSON 文件中的客户端电子邮件 ID。
- 针对 管理员帐户电子邮件,输入 Google Cloud 控制台的管理员电子邮件。
- 针对 私钥,输入凭证 JSON 文件中的私钥。
- 保存 回到了 定义访问和安全性 页面上发布服务提醒。
-
- 在 配置专有网络和安全组 部分,您可以选择一个 VPC 和子网,这些子网将包含将授予主机访问权限的数据源和安全组。 对于我们的配置,我们选择 无专有网络.
- 在 IAM角色 部分中,选择 创建一个新角色 并输入角色名称。
- 下一页.
-
- 点击 配置同步设置 页面,设置以下参数以同步从管理员电子邮件地址发送的所有电子邮件和电子邮件附件:
- 在 同步范围 部分,选择 邮件附件.
- 下 附加配置,为电子邮件配置过滤器以提取到 Amazon Kendra 索引中:
- 针对 日期范围, 输入要抓取的电子邮件的开始和结束日期。 在开始日期或之后以及结束日期之前收到的电子邮件包含在同步范围内。
- 针对 电子邮件域,输入您希望在索引中包含或排除的来自域的电子邮件、发送至域的电子邮件、主题、CC 和 BCC 电子邮件。 对于这篇文章,我们将来自域的电子邮件设置为管理员电子邮件地址。
- 针对 学科关键词, 包括或排除在其主题中至少提及一个关键字的任何文档。
- 针对 标签, 添加正则表达式模式以包含或排除某些标签或附件类型(最多 100 个模式)。
- 针对 附件, 添加正则表达式模式以包含或排除某些附件(最多 100 个模式)。
-
- 在 同步模式 部分,您可以指定完全同步以同步和索引所有实体中的所有内容,而不管之前的同步状态如何,或者只同步新的、修改的或删除的内容。 对于这篇文章,我们选择 全同步.
-
- 最后,我们为同步设置了合适的频率。 对于这篇文章,我们选择 按需运行.
- 下一页.
- 点击 设置字段映射 页面,您将所需数据源字段与索引中的字段相关联或创建映射。 您还可以为自定义索引字段创建映射。 您可以为邮件和邮件附件指定映射。 对于这篇文章,我们在 想说的话 部分:
- 选择 Gmail 字段映射主题、发件人和收件人。
- 下一页.
- 点击 查看并创建 页面,查看所有步骤并选择 添加数据源 创建您的 Gmail 连接器数据源。
- 创建数据源后,在 资料来源 页面,选择数据源(
kendra-gmail-connector
)并选择 立即同步.
同步所需的时间取决于与同步范围匹配的电子邮件数量和需要索引的附件大小。 如果您选择数据源并向下滚动到 同步运行历史 部分。 选择单个同步的状态以查看更多详细信息。
此部分显示同步的开始和结束时间,以及在同步期间添加、删除、失败或修改的文档数。 的状态 完成 表示没有故障的同步。 如果正在摄取的文档为空白,则同步状态设置为 完成但有错误 失败文档的数量列为 失败, 如以下屏幕截图所示。 如果同步失败,您可以通过选择失败文档的数量或通过选择 更多信息 列,它带来了 亚马逊CloudWatch 日志。 在下面的示例中,两个文档因空白而失败。
同步成功后,您可以在 Amazon Kendra 索引上执行搜索。
搜索索引内容
要搜索索引内容,请选择 搜索索引内容 在 Amazon Kendra 控制台的导航窗格中。
在搜索控制台上,输入任何自然语言问题。 在我们的示例中,我们询问“什么是 SageMaker”。 Amazon Kendra 根据同步范围对提取到索引中的电子邮件执行智能搜索并找到答案,如以下屏幕截图所示。
在这个例子中, 文档字段 部分显示了我们在配置数据源连接器时指定的字段映射。
清理
为避免产生未来成本,请清理您在此解决方案中创建的资源。 如果您在测试此解决方案时创建了新的 Amazon Kendra 索引,请将其删除。 如果您仅使用 Gmail 连接器添加了新数据源,请删除添加的数据源。
结论
在本文中,我们展示了组织现在如何使用适用于 Amazon Kendra 的 Gmail 连接器来允许用户对电子邮件和电子邮件附件执行智能搜索,从而提高员工工作效率和客户满意度。
此外,我们介绍了如何定义到 Amazon Kendra 数据源的字段映射,从而允许用户优化他们的搜索结果。
要了解有关 Amazon Kendra 的 Gmail 连接器的更多信息,请参阅 Gmail的 Amazon Kendra 的数据源连接器。
关于作者
肉山托马斯 是 Amazon Web Services 的高级解决方案架构师。 他常驻澳大利亚墨尔本,与电力和公用事业客户密切合作,以加速他们的云之旅。 他热衷于技术并帮助客户在 AWS 上设计和构建解决方案。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/perform-intelligent-search-across-emails-in-your-google-workspace-using-the-gmail-connector-for-amazon-kendra/
- :是
- :在哪里
- $UP
- 10
- 100
- 200
- 500
- 7
- 8
- 9
- a
- 关于
- 加快
- ACCESS
- 账号管理
- 账户
- 精准的
- 横过
- 添加
- 地址
- 管理员
- 高级
- 优点
- 后
- 算法
- 所有类型
- 允许
- 允许
- 还
- Amazon
- 亚马逊肯德拉
- 亚马逊网络服务
- 量
- an
- 和
- 回答
- 答案
- 任何
- API
- APIs
- 应用
- 相应
- 适当
- 保健
- AS
- 律师
- At
- 审计
- 澳大利亚
- 认证
- 授权
- 授权
- 避免
- AWS
- 基于
- BE
- 因为
- before
- 作为
- 都
- 带来
- 建立
- 商业
- by
- CAN
- 能力
- 案件
- 例
- 一定
- 查
- 选择
- 客户
- 密切
- 云端技术
- 合作
- 柱
- 完成
- 一台
- 配置
- 所连接
- 安慰
- 内容
- Contents
- 成本
- 可以
- 创建信息图
- 创建
- 创建
- 资历
- 习俗
- 顾客
- 客户体验
- 客户满意度
- 合作伙伴
- data
- 日期
- 重要日期
- 默认
- 定义
- 依靠
- 描述
- 详情
- 对话框
- 文件
- 文件
- 域
- 域名
- 向下
- 下载
- ,我们将参加
- 此前
- 或
- 邮箱地址
- 电子邮件
- 员工
- enable
- 使
- 加强
- 输入
- 实体
- 条目
- 必要
- 醚(ETH)
- 甚至
- 例子
- 现有
- 扩大
- 体验
- 特快
- 失败
- 失败
- 部分
- 字段
- 文件
- 过滤
- 过滤器
- 找到最适合您的地方
- 发现
- 遵循
- 以下
- 针对
- 法语
- 频率
- 止
- ,
- 未来
- Gmail的
- 谷歌
- 谷歌云
- 授予
- 团队
- 有
- he
- 帮助
- 帮助
- 高度
- 主持人
- 创新中心
- How To
- HTML
- HTTP
- HTTPS
- i
- ID
- 改善
- in
- 包括
- 包括
- 指数
- 指标
- 个人
- 信息
- 智能化
- 互动
- 成
- 调查
- IT
- 日文
- 旅程
- JPG
- JSON
- 键
- 键
- 已知
- 标签
- 语言
- 语言
- 学习用品
- 学习
- 自学资料库
- 喜欢
- 清单
- 已发布
- 圖書分館的位置
- 机
- 机器学习
- 经理
- 管理的
- 许多
- 制图
- 匹配
- 满足
- 墨尔本
- 提到
- 菜单
- 的话
- 条未读消息
- ML
- 改性
- 更多
- 姓名
- 自然
- 自然语言
- 自然语言处理
- 旅游导航
- 需求
- 需要
- 全新
- NLP
- 现在
- 数
- of
- on
- 一
- 仅由
- 打开
- 打开
- 操作
- 附加选项
- or
- 组织
- 组织
- 其他名称
- 我们的
- 最划算
- 页
- 面包
- 参数
- 部分
- 多情
- 模式
- 演出
- 执行
- 施行
- 权限
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 帖子
- 功率
- 供电
- 以前
- 私立
- 私钥
- 过程
- 处理
- 生产率
- 进展
- 项目
- 提供
- 提供
- 题
- 有疑问吗?
- 原因
- 收到
- 提炼
- 而不管
- 定期
- 删除
- 知识库
- 请求
- 必须
- 资源
- 成果
- 回报
- 检讨
- 角色
- 运行
- 安全
- sagemaker
- 满意
- 范围
- 滚动
- SDK
- 搜索
- 秘密
- 部分
- 保安
- 看到
- 前辈
- 服务
- 特色服务
- 集
- 设置
- 设置
- 如图
- 作品
- 尺寸
- 方案,
- 解决方案
- 来源
- 来源
- 指定
- 开始
- Status
- 步
- 步骤
- 商店
- 结构化
- 主题
- 子网
- 成功
- 支持
- 同步。
- 采取
- 需要
- 专业技术
- 测试
- 比
- 这
- 其
- 他们
- 那里。
- 从而
- 博曼
- 他们
- Free Introduction
- 通过
- 次
- 时
- 至
- 工具
- 最佳
- 类型
- 下
- 独特
- 用法
- 使用
- 用过的
- 用户
- 用户
- 运用
- 公用事业
- 价值观
- 通过
- 查看
- 走
- we
- 财富
- 卷筒纸
- Web服务
- 为
- 这
- 而
- 将
- 中
- 合作
- 您
- 您一站式解决方案
- 和风网