亚马逊预报 是一项完全托管的服务,它使用机器学习 (ML) 生成高度准确的预测,无需任何先前的 ML 经验。 Forecast 适用于各种用例,包括估算库存管理的供需、旅行需求预测、劳动力规划和计算云基础设施使用情况。
您可以使用 Forecast 以最快 80% 的速度无缝执行假设分析,以分析和量化业务杠杆对您的需求预测的潜在影响。 假设分析可帮助您调查和解释不同的场景如何影响 Forecast 创建的基线预测。 使用 Forecast,无需配置服务器或手动构建 ML 模型。 此外,您只需为使用的内容付费,没有最低费用或前期承诺。 要使用 Forecast,您只需提供您想要预测的历史数据,以及您认为可能会影响您的预测的任何其他数据(可选)。
自来水供应商有几个预测用例,但其中最主要的是预测一个地区或建筑物的用水量以满足需求。 此外,对于公用事业供应商来说,预测由于建筑物中增加的公寓或该地区更多的房屋而增加的消费需求也很重要。 准确预测用水量对于避免对客户的任何服务中断至关重要。
这篇文章探讨了使用 Forecast 通过使用历史时间序列数据来解决这个用例。
解决方案概述
水是一种自然资源,对工业、农业、家庭和我们的生活都至关重要。 准确的用水量预测对于确保机构能够高效地开展日常运营至关重要。 用水量预测特别具有挑战性,因为需求是动态的,季节性天气变化会产生影响。 准确预测用水量非常重要,这样客户就不会面临任何服务中断,并在保持低价的同时提供稳定的服务。 改进的预测使您能够提前计划以构建更具成本效益的未来合同。 以下是两个最常见的用例:
- 更好的需求管理 – 作为公用事业提供商机构,您需要在供水需求之间找到平衡点。 在提供服务之前,该机构会收集居住在公寓中的人数和建筑物中的公寓数量等信息。 作为公用事业机构,您必须平衡总供求。 您需要储存足够的水以满足需求。 此外,由于以下原因,需求预测变得更具挑战性:
- 需求并非始终稳定,全天都在变化。 例如,与早上相比,午夜的用水量要少得多。
- 天气也会对整体消费产生影响。 例如,北半球夏季的用水量高于冬季,而南半球则相反。
- 降雨量不足或蓄水机制(湖泊、水库)不足,或水过滤不充分。 在夏季,需求总是跟不上供应。 水务机构必须仔细预测以获取可能更昂贵的其他来源。 因此,对于公用事业机构来说,寻找替代水源至关重要,例如收集雨水、收集空气处理装置的冷凝水或回收废水。
- 对增加的需求进行假设分析 – 由于多种原因,对水的需求正在上升。 这包括人口增长、经济发展和不断变化的消费模式的结合。 让我们想象这样一个场景,现有的公寓楼扩建,家庭和人口的数量增加了一定比例。 现在您需要进行分析以预测增加需求的供应。 这也有助于您为增加的需求制定具有成本效益的合同。
预测可能具有挑战性,因为您首先需要准确的模型来预测需求,然后需要一种快速简单的方法来在一系列场景中重现预测。
这篇文章重点介绍执行用水量预测和假设分析的解决方案。 这篇文章不考虑模型训练的天气数据。 但是,您可以添加天气数据,因为它与用水量相关。
先决条件
在开始之前,我们设置了我们的资源。 对于这篇文章,我们使用 us-east-1 区域。
- 创建 亚马逊简单存储服务 (Amazon S3) 用于存储历史时间序列数据的桶。 有关说明,请参阅 创建您的第一个 S3 存储桶.
- 从下载数据文件 GitHub回购 并上传到新创建的 S3 存储桶。
- 创建一个新的 AWS身份和访问管理 (我是) 角色。 有关说明,请参见 为 Amazon Forecast 设置权限. 请务必提供您的 S3 存储桶的名称。
创建数据集组和数据集
这篇文章展示了两个与水需求预测相关的用例:根据过去的用水量预测水需求,以及对增加的需求进行假设分析。
Forecast 可以接受三种类型的数据集:目标时间序列 (TTS)、相关时间序列 (RTS) 和项目元数据 (IM)。 目标时间序列数据定义了您预测的资源的历史需求。 目标时间序列数据集是必需的。 相关时间序列数据集包含未包含在目标时间序列数据集中的时间序列数据,可能会提高预测器的准确性。
在我们的示例中,目标时间序列数据集包含 item_id 和时间戳维度,互补相关时间序列数据集包含 no_of_consumer。 此数据集的重要说明:TTS 在 2023-01-01 结束,RTS 在 2023-01-15 结束。 在执行假设场景时,重要的是在 TTS 中操作超出已知时间范围的 RTS 变量。
为了进行假设分析,我们需要导入两个代表目标时间序列数据和相关时间序列数据的 CSV 文件。 我们的示例目标时间序列文件包含 item_id、时间戳和需求,我们的相关时间序列文件包含产品 item_id、时间戳和 no_of consumer。
要导入您的数据,请完成以下步骤:
- 在“预测”控制台上,选择 查看数据集组。
- 创建数据集组。
- 针对 数据集组名称, 输入名称(对于此帖子,
water_consumption_datasetgroup
). - 针对 预测范围,选择一个预测域(对于这篇文章, 定制版).
- 下一页.
- 点击 创建目标时间序列数据集 页面,提供数据集名称、数据频率和数据模式。
- 点击 数据集导入详细信息 页面,输入数据集导入名称。
- 针对 导入文件类型, 选择 CSV 并输入数据位置。
- 选择您之前创建的 IAM 角色作为先决条件。
- Start 开始.
您将被重定向到可用于跟踪进度的仪表板。
- 要导入相关的时间序列文件,在仪表板上,选择 进口.
- 点击 创建相关的时间序列数据集 页面,提供数据集名称和数据架构。
- 点击 数据集导入详细信息 页面,输入数据集导入名称。
- 针对 导入文件类型, 选择 CSV 并输入数据位置。
- 选择您之前创建的 IAM 角色。
- Start 开始.
训练预测变量
接下来,我们训练一个预测器。
- 在仪表板上,选择 Start 开始 下 训练预测变量.
- 点击 训练预测器 页面,为您的预测器输入名称。
- 指定您希望预测未来多长时间以及频率。
- 指定要预测的分位数数。
Forecast 使用 AutoPredictor 创建预测变量。 有关详细信息,请参阅 训练预测器.
- 创建.
创建一个预测
在我们的预测器被训练后(这可能需要大约 3.5 小时),我们创建一个预测。 当您看到 查看预测变量 仪表板上的按钮。
- Start 开始 下 生成预测 在仪表板上。
- 点击 创建一个预测 页面,输入预测名称。
- 针对 预报器, 选择您创建的预测变量。
- 或者,指定预测分位数。
- 指定要为其生成预测的项目。
- Start 开始.
查询您的预测
您可以使用查询预测 查询预报 选项。 默认情况下,返回预测的完整范围。 您可以请求完整预测中的特定日期范围。 查询预测时,必须指定过滤条件。 过滤器是键值对。 键是来自用于创建预测的数据集之一的模式属性名称之一(包括预测维度)。 该值是指定键的有效值。 您可以指定多个键值对。 返回的预测将仅包含满足所有条件的项目。
- 查询预报 在仪表板上。
- 提供开始日期和结束日期的过滤条件。
- 指定您的预测键和值。
- 获取预测.
以下屏幕截图显示了使用预测模型预测同一公寓(项目 ID A_10001)的能源消耗。
创建假设分析
在这一点上,我们已经创建了我们的基线预测,现在可以进行假设分析。 让我们想象这样一个场景,现有的公寓楼增加了一个扩建部分,家庭和人数增加了 20%。 现在您需要进行分析以预测基于需求增加的供应增加。
执行假设分析分为三个阶段:设置分析、通过定义场景中发生的变化来创建假设预测,以及比较结果。
- 要设置分析,请选择 探索假设分析 在仪表板上。
- 创建.
- 输入唯一名称并选择基线预测。
- 选择数据集中您要对其进行假设分析的项目。 你有两个选择:
- 选择所有项目 是默认值,我们在这篇文章中选择。
- 如果要选择特定项目,请选择 选择带有文件的项目 并导入一个 CSV 文件,其中包含相应项目和任何关联维度的唯一标识符。
- 创建假设分析.
创建假设预测
接下来,我们创建一个假设预测来定义我们想要分析的场景。
- 在 假设预测 部分中,选择 创建.
- 输入场景的名称。
- 您可以通过两个选项定义您的场景:
- 使用转换函数 – 使用转换构建器转换您导入的相关时间序列数据。 在本演练中,我们评估当消费者数量与基线预测中的价格相比增加 20% 时,对数据集中某项商品的需求如何变化。
- 使用替换数据集定义假设预测 – 替换您导入的相关时间序列数据集。
对于我们的示例,我们创建了一个场景,其中我们增加 no_of_consumer
20% 适用于商品 ID A_10001
及 no_of_consumer
是数据集中的一个特征。 您需要此分析来预测供水并满足增加的需求。 此分析还可以帮助您根据用水需求预测制定具有成本效益的合同。
- 针对 假设预测定义方法, 选择 使用转换函数.
- 乘 作为我们的运营商,no_of_consumer 作为我们的时间序列,并输入 1.2。
- 添加条件.
- 等于 作为操作并为 item_id 输入 A_10001。
- 创建.
比较预测
现在,我们可以比较两种情景的假设预测,将消费者增长 20% 与基线需求进行比较。
- 在分析见解页面上,导航到 比较假设预测 部分。
- 针对 ITEM_ID,输入要分析的项目(在我们的场景中,输入
A_10001
). - 针对 假设预测,选择
water_demand_whatif_analyis
. - 比较假设.
- 您可以为分析选择基线预测。
下图显示了我们场景的最终需求。 红线表示未来人口增加 20% 的用水量预测。 P90 预测类型表示真实值预计在 90% 的时间内低于预测值。 您可以使用此需求预测来有效管理供水以满足增加的需求并避免任何服务中断。
导出您的数据
要将数据导出到 CSV,请完成以下步骤:
- 创建导出.
- 输入导出文件的名称(对于这篇文章,
water_demand_export
). - 通过选择场景来指定要导出的场景 假设预测 下拉式菜单。
您可以在一个组合文件中一次导出多个场景。
- 针对 出口地点, 指定 Amazon S3 位置。
- 要开始导出,请选择 创建导出.
- 要下载导出,请导航到 Amazon S3 控制台上的 S3 文件路径位置,选择文件,然后选择 下载.
导出文件将包含 timestamp
, item_id
及 forecasts
对于所有选定场景(包括基本场景)的每个分位数。
清理资源
为避免产生未来费用,请删除此解决方案创建的资源:
结论
在这篇文章中,我们向您展示了如何使用 Forecast 及其底层系统架构来使用用水量数据预测用水需求是多么容易。 假设情景分析是帮助应对业务不确定性的重要工具。 它提供了远见和压力测试想法的机制,使企业更有弹性,准备更充分,并能掌控自己的未来。 电力或天然气供应商等其他公用事业供应商可以使用 Forecast 以经济高效的方式构建解决方案并满足公用事业需求。
这篇文章中的步骤演示了如何在 AWS管理控制台. 要直接使用 Forecast API 来构建解决方案,请按照我们的笔记本进行操作 GitHub回购.
我们鼓励您通过访问 亚马逊预测开发人员指南 并使用与您的业务 KPI 相关的数据集试用这些服务支持的端到端解决方案。
关于作者
德拉伊·塔库尔(Dhiraj Thakur) 是Amazon Web Services的解决方案架构师。 他与AWS客户和合作伙伴合作,提供有关企业云采用,迁移和策略的指南。 他对技术充满热情,并喜欢在分析和AI / ML领域中进行构建和试验。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/build-a-water-consumption-forecasting-solution-for-a-water-utility-agency-using-amazon-forecast/
- 1
- 11
- a
- 关于我们
- 接受
- ACCESS
- 精准的
- 准确
- 获得
- 横过
- 添加
- 额外
- 另外
- 地址
- 添加
- 采用
- 影响
- 机构
- 机构
- 农业
- 向前
- AI / ML
- 加拿大航空
- 所有类型
- 替代
- 时刻
- Amazon
- 亚马逊预报
- 亚马逊网络服务
- 其中
- 分析
- 分析
- 分析
- 和
- 公寓
- 公寓
- APIs
- 相应
- 约
- 架构
- 国家 / 地区
- 围绕
- 相关
- 避免
- AWS
- 当前余额
- 基地
- 基于
- 底线
- 因为
- 成为
- before
- 相信
- 更好
- 之间
- 超越
- 建立
- 建设者
- 建筑物
- 建立
- 商业
- 企业
- 按键
- 捕获
- 小心
- 案件
- 例
- 一定
- 挑战
- 更改
- 改变
- 收费
- 云端技术
- 云采用
- 云基础设施
- 收集
- 组合
- 结合
- 承诺
- 相当常见
- 比较
- 相比
- 比较
- 补充
- 完成
- 计算
- 进行
- 开展
- 考虑
- 安慰
- 消费者
- 消费者
- 消费
- 包含
- 合同
- 合同的
- 控制
- 相关
- 相应
- 经济有效
- 创建信息图
- 创建
- 创造
- 标准
- 危急
- 顾客
- 合作伙伴
- XNUMX月XNUMX日
- data
- 数据集
- 日期
- 天
- 默认
- 定义
- 定义
- 需求
- 需求预测
- 证明
- 开发商
- 研发支持
- 不同
- 尺寸
- 直接
- 不会
- 域
- 别
- 下载
- ,我们将参加
- 动态
- 每
- 此前
- 经济
- 经济发展
- 只
- 有效
- 电力
- 启用
- 使
- 鼓励
- 端至端
- 结束
- 能源
- 能源消费
- 更多
- 输入
- 企业
- 醚(ETH)
- 评估
- 例子
- 现有
- 预期
- 昂贵
- 体验
- 说明
- 出口
- 延期
- 面部彩妆
- 快
- 专栏
- 费
- 文件
- 档
- 过滤
- 过滤
- 找到最适合您的地方
- 姓氏:
- 重点
- 遵循
- 以下
- 收益预测
- 频率
- 止
- 充分
- 功能
- 未来
- 天然气
- 生成
- 越来越
- 特定
- 图形
- 团队
- 组的
- 事业发展
- 处理
- 野生捕捞
- 帮助
- 帮助
- 更高
- 高度
- 历史的
- 地平线
- HOURS
- 户
- 房屋
- 创新中心
- How To
- 但是
- HTML
- HTTPS
- IAM
- 思路
- 识别码
- 身分
- 影响力故事
- 进口
- 重要
- 改善
- 改善
- in
- 包括
- 包括
- 包含
- 增加
- 增加
- 增加
- 表示
- 行业中的应用:
- 信息
- 基础设施
- 可行的洞见
- 说明
- 库存
- 库存管理
- 调查
- IT
- 项目
- 保持
- 键
- 知道
- 已知
- 学习用品
- 学习
- 离开
- Line
- 生活
- 活的
- 圖書分館的位置
- 长
- 低
- 低价
- 机
- 机器学习
- 使
- 管理
- 管理
- 颠覆性技术
- 强制性
- 手动
- 机制
- 满足
- 菜单
- 元数据
- 可能
- 移民
- 最低限度
- ML
- 模型
- 模型
- 更多
- 早晨
- 最先进的
- 多
- 姓名
- 名称
- 自然
- 导航
- 需求
- 全新
- 笔记本
- 数
- 一
- 操作
- 运营
- 操作者
- 附加选项
- 附加选项
- 秩序
- 其他名称
- 最划算
- 对
- 尤其
- 伙伴
- 多情
- 过去
- 径
- 模式
- 员工
- 百分比
- 演出
- 执行
- 权限
- 挑
- 计划
- 规划行程
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 人口
- 帖子
- 潜力
- 预测
- 都曾预测
- 预测
- 预报器
- 准备
- 车资
- 价格
- 小学
- 先
- 产品
- 进展
- 提供
- 提供者
- 供应商
- 提供
- 优
- 规定
- 快速
- 范围
- 原因
- 红色
- 地区
- 有关
- 相应
- 去掉
- 更换
- 代表
- 请求
- 弹性
- 资源
- 资源
- 导致
- 成果
- 上升
- 角色
- 运行
- 同
- 情景
- 无缝
- 部分
- 选
- 选择
- 系列
- 服务
- 特色服务
- 集
- 设置
- 几个
- 作品
- 简易
- So
- 方案,
- 解决方案
- 来源
- 南
- 太空
- 具体的
- 指定
- 稳定
- 实习
- 开始
- 开始
- 步骤
- 存储
- 商店
- 策略
- 结构体
- 足够
- 夏季
- 供应
- 供需平衡
- 系统
- 采取
- 目标
- 专业技术
- 区域
- 未来
- 其
- 因此
- 三
- 通过
- 始终
- 次
- 时间序列
- 时
- 时间戳
- 至
- 工具
- 跟踪时
- 培训
- 熟练
- 产品培训
- 改造
- 转型
- 旅行
- true
- 真实的价值
- 类型
- 不确定性
- 下
- 相关
- 独特
- 单位
- 用法
- 使用
- 用例
- 效用
- 折扣值
- 各种
- 演练
- 水
- 天气
- 卷筒纸
- Web服务
- 什么是
- 什么是
- 这
- 而
- 宽
- 将
- 冬季
- 中
- 也完全不需要
- 劳动力
- 合作
- 您一站式解决方案
- 和风网