亚马逊SageMaker Studio 是用于机器学习 (ML) 的完全集成开发环境 (IDE),部分基于 木星实验室 3. Studio 提供基于 Web 的界面,以交互方式执行准备数据以及构建、训练和部署 ML 模型所需的 ML 开发任务。 在 Studio 中,您可以加载数据、调整 ML 模型、在步骤之间移动以调整实验、比较结果以及部署 ML 模型以进行推理。
AWS云开发套件 (AWS CDK) 是一个开源软件开发框架,用于创建 AWS CloudFormation 栈 通过自动 CloudFormation 模板 一代。 堆栈是 AWS 资源的集合,可以通过编程方式更新、移动或删除。 AWS CDK 结构体 是 AWS CDK 应用程序的构建块,代表定义云架构的蓝图。
使用 AWS CDK 设置 Studio 已成为一个简化的过程。 AWS CDK 允许您使用本机构造来使用基础设施即代码 (IaC) 来定义和部署 Studio,包括 AWS身份和访问管理 (AWS IAM) 权限和所需的云资源配置,全部集中在一处。 这种开发方法可以与其他常见的软件工程最佳实践结合使用,例如自动代码部署、测试和 CI / CD管道. AWS CDK 减少了执行典型基础设施部署任务所需的时间,同时通过自动化缩小了人为错误的表面积。
这篇文章将指导您完成开始设置和部署 Studio 的步骤,以标准化 ML 模型开发以及与其他 ML 工程师和 ML 科学家的协作。 帖子中的所有示例都是用 Python 编程语言编写的。 但是,AWS CDK 提供了对多个 其他编程语言 像 JavaScript、Java 和 C#。
先决条件
要开始使用,需要满足以下先决条件:
克隆 GitHub 存储库
成功拉取仓库后,您可以查看包含以下资源的 cdk 目录:
- 光盘 – 包含主要的cdk资源
- 应用程序 – 定义 AWS CDK 堆栈的位置
- cdk.json文件 – 包含元数据和功能标志
AWS CDK 脚本
我们要查看的两个主要文件 cdk
子目录是 sagemaker_studio_construct.py
和 sagemaker_studio_stack.py
. 让我们更详细地看一下每个文件。
工作室构建文件
Studio 结构定义在 sagemaker_studio_construct.py
文件中。
Studio 构造采用 虚拟私有云 (VPC)、列出的用户、AWS 区域和底层默认实例类型作为参数。 此 AWS CDK 构造具有以下功能:
- 创建 Studio 域 (
SageMakerStudioDomain
) - 设置 IAM 角色
sagemaker_studio_execution_role
AmazonSageMakerFullAccess
创建资源所需的权限。 权限需要进一步缩小以遵循最小权限原则以提高安全性。 - 设置 Jupyter 服务器应用程序设置——接受
JUPYTER_SERVER_APP_IMAGE_NAME
, 定义要使用的 jupyter-server-3 容器镜像。 - 设置内核网关应用程序设置 - 接受
KERNEL_GATEWAY_APP_IMAGE_NAME
, 定义要使用的 datascience-2.0 容器镜像。 - 为每个列出的用户创建用户配置文件
以下代码片段显示了 AWS CDK 中定义的相关 Studio 域 AWS CloudFormation 资源:
以下代码片段显示了从 AWS CloudFormation 资源创建的用户配置文件:
工作室堆栈文件
定义构造后,您可以通过创建类的实例并在堆栈中传递所需的参数来添加它。 该堆栈创建 AWS CloudFormation 资源作为一个连贯部署的一部分。 这意味着如果至少一个云资源创建失败,CloudFormation 堆栈将回滚执行的任何更改。 Studio 构造的以下代码片段在 Studio 堆栈内部实例化:
部署 AWS CDK 堆栈
要部署您的 AWS CDK 堆栈,请在终端窗口中从项目的根目录运行以下命令:
aws configure
pip3 install -r requirements.txt
cdk bootstrap --app "python3 -m cdk.app"
cdk deploy --app "python3 -m cdk.app"
查看 AWS CDK 在您的 AWS 账户中创建的资源,并在提示部署堆栈时选择是。 等待堆栈部署完成。 这通常需要不到 5 分钟; 但是,添加更多资源会延长部署时间。 您还可以在 AWS CloudFormation 控制台.
成功部署堆栈后,转到 Studio 控制面板检查其信息。 您应该会看到您创建的 SageMaker Studio 用户配置文件。
如果您重新部署堆栈,它将检查更改,仅执行必要的云资源更新。 例如,这可用于添加用户或更改权限 这些用户无需重新创建所有已定义的云资源.
净化
要删除堆栈,请完成以下步骤:
- 在AWS CloudFormation控制台上,选择 堆栈 在导航窗格中。
- 打开要删除的堆栈。
- 在堆栈详细信息窗格中,选择 删除.
- 删除堆栈 提示时。
AWS CloudFormation 将删除部署堆栈时创建的资源。 这可能需要一些时间,具体取决于创建的资源量。
如果您在执行这些清理步骤时遇到任何问题,您可能需要 手动删除 Studio 域 在重复本节中的步骤之前。
结论
在本文中,我们展示了如何使用 AWS 云原生 IaC 资源为 Studio 部署构建一个易于重用的模板。 SageMaker Studio 是一个完全集成的基于 Web 的 IDE,它为基于 JupyterLab3 的 ML 开发任务提供可视化界面。 借助 AWS CDK 堆栈,我们能够定义构建云组件的结构,这些组件可以通过更改底层 CloudFormation 堆栈轻松修改、编辑或删除。
有关 Amazon Studio 的更多信息,请参阅 亚马逊SageMaker Studio.
作者简介
科里·海尔斯顿 是 Amazon ML 解决方案实验室的软件工程师。 他热衷于学习新技术并利用这些信息构建可重用的软件解决方案。 他是一名狂热的举重运动员,并利用空闲时间制作数字艺术。
马塞洛·阿伯勒 是 AWS AI 组织的 ML 工程师。 他在 Amazon ML 解决方案实验室领导 MLOps 工作,帮助客户设计和实施可扩展的 ML 系统。 他的使命是指导客户进行企业 ML 之旅,并加速他们的 ML 生产路径。
亚什沙 是科学经理 亚马逊机器学习解决方案实验室. 他和他的应用科学家和机器学习工程师团队致力于医疗保健、体育、汽车和制造业的一系列机器学习用例。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/set-up-amazon-sagemaker-studio-with-jupyter-lab-3-using-the-aws-cdk/
- 1
- 100
- a
- Able
- 关于我们
- 加快
- ACCESS
- 账号管理
- AI
- 所有类型
- 允许
- Amazon
- 亚马逊机器学习解决方案实验室
- 亚马逊SageMaker
- 亚马逊SageMaker Studio
- 量
- 和
- 应用
- 应用领域
- 应用的
- 使用
- 的途径
- 热心
- 国家 / 地区
- 参数
- 艺术
- 自动化
- 自动化
- 汽车
- AWS
- AWS CloudFormation
- 背部
- 基于
- 成为
- before
- 最佳
- 最佳实践
- 之间
- 吹氣梢
- 引导
- 建立
- 建筑物
- 内建的
- 例
- 更改
- 更改
- 查
- 云端技术
- 码
- 相干
- 合作
- 采集
- 组合
- 相当常见
- 比较
- 完成
- 组件
- 安慰
- 建设
- 容器
- 包含
- 控制
- 控制面板
- 创建信息图
- 创建
- 创建
- 创造
- 创建
- 合作伙伴
- data
- 默认
- 定义
- 根据
- 部署
- 部署
- 部署
- 部署
- 部署
- 设计
- 细节
- 详情
- 研发支持
- 数字
- 数码艺术
- 禁用
- 域
- 向下
- 每
- 容易
- 工作的影响。
- 遭遇
- 工程师
- 工程师
- 工程师
- 企业
- 环境
- 错误
- 醚(ETH)
- 例子
- 例子
- 失败
- 专栏
- 同伴
- 文件
- 档
- 姓氏:
- 遵循
- 以下
- 骨架
- Free
- 止
- 充分
- 功能
- 进一步
- 网关
- 代
- 得到
- GitHub上
- 去
- 指南
- 指南
- 有
- 医疗保健
- 帮助
- 创新中心
- How To
- 但是
- HTML
- HTTPS
- 人
- IAC
- IAM
- 身分
- 图片
- 实施
- 改善
- in
- 信息
- 基础设施
- 安装
- 例
- 集成
- 接口
- 问题
- IT
- 爪哇岛
- JavaScript的
- 旅程
- JSON
- 实验室
- 语言
- 领导
- 学习
- 借力
- 已发布
- 加载
- 看
- 机
- 机器学习
- 主要
- 制作
- 经理
- 制造业
- 手段
- 元数据
- 分钟
- 使命
- ML
- 多播
- 模型
- 模型
- 改性
- 更多
- 移动
- 多
- 本地人
- 旅游导航
- 必要
- 需求
- 全新
- 新技术
- 优惠精选
- 一
- 开放源码
- 开源软件
- 组织
- 其他名称
- 面包
- 面板
- 参数
- 部分
- 通过
- 径
- 演出
- 执行
- 权限
- 地方
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 帖子
- 做法
- Prepare
- 先决条件
- 原理
- 私立
- 过程
- 生产
- 本人简介
- 简介
- 代码编程
- 项目
- 提供
- 蟒蛇
- 范围
- 减少
- 地区
- 相应
- 知识库
- 代表
- 必须
- 岗位要求
- 资源
- 资源
- 成果
- 可重复使用
- 角色
- 卷
- 根
- 运行
- sagemaker
- 可扩展性
- 科学
- 科学家
- 范围
- 部分
- 保安
- 自
- 服务
- 集
- 设置
- 设置
- 应该
- 作品
- 软件
- 软件开发
- 软件工程师
- 软件工程
- 解决方案
- 一些
- 运动
- 堆
- 堆栈
- 开始
- Status
- 步骤
- 精简
- 工作室
- 顺利
- 这样
- SUPPORT
- 磁化面
- 系统
- 产品
- 采取
- 需要
- 任务
- 团队
- 技术
- 模板
- 终端
- 测试
- 其
- 通过
- 次
- 至
- 培训
- 普遍
- 一般
- 相关
- 更新
- 最新动态
- 使用
- 用户
- 用户
- 在线会议
- 等待
- 基于网络的
- 而
- 将
- 中
- 也完全不需要
- 工作
- 书面
- 您一站式解决方案
- 和风网