比特币 Gemini Netflow

行业的数据科学工具:滚动四舍五入来处理那些讨厌的小数

源节点: 1861021

总结

在供应链管理的许多领域,分析方法会生成带有“讨厌的小数”的估计值;例如,需求估算和生产计划。消除烦人的小数的传统方法是四舍五入。然而,这也会导致关键信息(累积总和)的丢失,这通常会低估或夸大公司的工作量。滚动舍入方法将此信息损失上限限制为 1。本博客演示了此方法的重要性以及如何计算这些改进的整数估计。

介绍

当与“munchkins”(孙子)共度时光时,很清楚为什么正整数(可能带零)被称为自然数;计数很直观。同样的舒适感也出现在供应链管理中。如果时间序列预测方法预测每日需求为 3.1、4.2 和 2.3,那么我们就会倾向于摆脱那些讨厌的小数。如果 产品计划 说日产量应该是2.9、3.1、1.7,我们也有同样的感觉。问题是如何最好地消除小数,其中最好的定义是最大限度地减少丢失的信息量。

传统方法是将每个单独的值四舍五入为整数,并假设“舍入误差”将会平衡。然而,情况并非总是如此。表 1 包含三种产品(产品 14、1 和 2)3 天的需求估计。实际需求估计值在第二、三和四列中。每种产品的需求总和(53.1、50.0 和 48.7)在倒数第二行中提供。四舍五入的要求位于第五列至第七列中,其总数位于倒数第二行中(50、51、52)。最后一行显示实际估计值总和与四舍五入估计值总和之间的详细信息。产品 1 (3.1) 和产品 3 (-3.3) 存在相当大的差异。

我们需要的是一种“舍入”方法,将累积和的差值限制为 1,并确保舍入值的累积和大于实际值的累积和。这称为“滚动舍入”。该博客提供了一种滚动舍入的算法。它是行业数据科学工具系列的一部分。

机器学习和数据科学行业工具:一阶差分

行业工具:如何比较/组合不同的时间序列——“标准化”

行业数据科学工具:蒙特卡罗计算机模拟

滚圆的基础知识

我们将从累积和的示例开始。表 2 列出了产品 1 的需求估算以及实际估算和整数估算的累计总和。第 3 列是累计实际值。第 1 天是第 1 天的需求估算。第 2 天是第 1 天 (3.1) 的累计总和加上第 2 天 (4.2) 的需求估算,即 7.3。第 3 天是 7.3 + 2.3 = 9.6 第 4 列是整数估计值的累积和。第 3 天 (9) = 7+2。最后一列是每天每个累积总和之间的增量。第 4 天的增量值为 -0.7 = 15.0 – 15.7。观察三角洲不断扩大的规模。

我们使用什么算法来生成整数估计值,其中整数估计值的累积和始终大于或等于实际值的累积和,并且 delta 的大小永远不会大于 1?表 3 演示了该算法。

  1. 第 1 天,滚动轮估计是上限(向上舍入),此处为 3.1 → 第 1 天的整数估计的累积和为 4。
  2. 第 2 天,我们将实际估计值的下限值 (4.2 → 4) 添加到第 1 天的累积估计值 (4),得到 8 (=4+4)。如果该值大于或等于第 1 天的实际累积总和(即 7.3),则我们选择第 2 天的下限值和滚动舍入估计值。如果不是,则使用上限估计值。
  3. 第3天,2(楼层)+8(整数累计和)=10,即>=9.6(实际累计和),选择楼层(2)。
  4. 第 6 天,3(下限)+ 20(整数累计和)= 23,即 < 23.1(实际累计和),选择上限 (4) 作为第 6 天的滚动估算。

观察表3的最后一列,所有值都是正数并且都小于或等于1。 

表 4 演示了另一种算法。步骤 1 是计算实际累积和的上限值(如第 4 列所示)。滚动舍入估计(第 5 栏)是今天与昨天的实际累计总和上限(第 4 栏)之间的差异。第 4 天 (6) 的滚动估算为第 4 天累计金额上限 (16) 减去第 3 天累计金额上限 (10); 6 = 16-10。在 APL2 中,代码为“Z1←¯2- /0,⌈+X”。

结论

在供应链管理的许多领域,分析方法会生成带有“讨厌的小数”的估计值。例如,需求估算和生产计划。消除烦人的小数的传统方法是四舍五入。然而,这也会导致关键信息的丢失;累计总和往往会低估或高估公司的工作量。滚动舍入方法将此信息损失上限限制为 1。

喜欢这篇文章吗? 订阅 或关注 Arkieva LinkedInTwitter及 Facebook 博客更新.

资料来源:https://blog.arkieva.com/data-science-tools-of-the-trade-rounding-decimals/

时间戳记:

更多来自 供应链链接博客 – Arkieva