智慧供应链预测算法
如果无法正常显示,请先停止浏览器的去广告插件。
1. 供应链预测算法及应用
王桐
阿里巴巴-数字供应链事业部
2021年6月
2. Outline:
• 预测场景及特性
• 预测算法研发路线及结果
• 预测应用案例
3. 供应链预测场景及特性
供应链不确定性的第一道防火墙!
T-1y
T-8w
T-4w
T-1w
T-1d
(离线)GMV预测:支持长期经营计划
T-1h
T
(实时)GMV预测:支持实时前端调控
(离线)商品销量预测:支持补货、调拨决策
(实时)销量预测:支持临时补货
(离线)仓单量预测:支持仓库、配送产能(人力)准备
(实时)单量预测:支持实时产能调控
预测场景细分方式:
•
预测标的:GMV、销量、单量、客服呼叫量、云计算请求量等各种不确定的需求
•
提前期:离线(长期(y, m)、中期(w)、短期(d))、实时(h)
•
颗粒度:预测对象颗粒度(店铺、行业、类目;商品、sku、货品;货主、行业)* 时间颗粒度(月、周、日、小时) * 空间颗粒度(全国、大区、省、市、区、街道;仓、门店)
•
用途:下游优化算法、决策系统(高准确率、高可用性)、人肉计划(算法白盒化、可解释性、可调整性)
GMV预测 销量预测 单量预测
预测标的:GMV 预测标的:销量(需求) 预测标的:交易单/物流单数量
提前期:未来1个月、一年 提前期:未来1~8周 提前期:未来1天,未来1周
颗粒度: 行业*天*全国,行业 *月*全国 颗粒度: 货品*天*仓 颗粒度: 货主*天*仓,行业 *天*仓
用途:支持整体经营计划(KPI制定,营销资源分配,供 用途:支持采购、补货、调拨决策 用途:支持仓库端人力准备
应链资源分配) 评估口径:minmax,加权平均 评估口径:1-MAPE,加权平均
评估口径:达成率 real/fcst
4. 预测算法研发路线
第一代:传统时间序列统计方法 第二代:特征工程+经典机器学习算法 第三代:深度学习算法
(指数平滑、ARIMA、Holt-Winters) (GBDT/XGB/LGB、随机森林、SVR) (CNN,RNN,Attention)
1. 准确性:低 1. 准确性:较高 2. 稳定性:高 2. 稳定性:较低 前景:轻松克服左边的全部技术局限;深度学习在CV、
NLP、搜索&推荐&广告等领域先后取得颠覆性突破
3. 可调整性: 低(后处理) 3. 可调整性: 中(特征工程 + 调超参) 4. 可解释性:高(逻辑易于理解) 4. 可解释性:低(黑盒算法,只能解释输入输出) 5. 执行效率:低(针对单条时序) 5. 执行效率:高(可批量训练/预测) 应用局限:后处理(规则)工作重 应用局限:调超参纯靠体力、算力 ; 特征工程强依赖人工
技术局限:难以拟合脉冲性波动;无法灵活引入海量协变
量(特征)信息;无法描述复杂的交叉影响
判断、业务理解、数据探查、写SQL能力
技术局限:时序特征提取;类别变量的编码;损失函数选
择有限;端到端学习能力有限;训练策略难以定制
1. 准确性:较高
2. 稳定性:很低
3. 可调整性: 高 (特征、超参、模型结构、训练策略)
4. 可解释性:低(黑盒算法,只能解释输入输出)
5. 执行效率:低(模型较重,GPU训练成本较高)
应用局限:炼丹工作重,训练时间长,摸索成本高
技术局限:模型重,数据量要求高;时序针对性低
5. 自研深度学习时序预测算法--Falcon
深度学习时间序列算法目标
1. 准确性:较高 => 高(显著、稳定地高于LGB)
2. 稳定性:低 => 高(达到统计方法的水准)
3. 可调整性: 高 (特征、超参、模型结构、训练策略)
4. 可解释性:低 => 较高(一定的白盒化能力)
5. 执行效率:低 => 高(严格控制模型规模)
Falcon是什么
算法:
• 多block叠加的残差链接主干网络,类似n-beats (右图)结构,实现时序成份分解
• 丰富的block库捕捉时序的各种成份(趋势、周期/季节、脉冲、节假日、其他数值特征),个性化按需
组装
• 参数规模:数千;训练时间:几小时
框架:
• 一套相对通用的算法框架,方便算法研发&验证&沉淀(时序对齐、采样,类别变量embedding,多种训
练策略)
Oreshkin et al. 2020
6. 自研深度学习时序预测算法--Falcon
•
•
M4和M5数据集预测指标排名前1% 2021 AI Earth 创新挑战赛第4名
世界最具影响力的预测竞赛,全球5000+支队 •
气候时序预测大赛:全球2849支队伍
2021 IEEE 电力负荷预测第5名
•
电力负荷预测大赛:有法国电力公司、
伍参赛M5 参赛,覆盖全球近400所高校、96家 广东电网公司等多家专业电力行业企
Falcon纯深度学习算法相关指标达到前1% 企业 业参赛,考察算法对疫情后电力负荷
阿里参赛预测算法较Nature最新论文 随时间连续变化的适应度
(回测)
•
成果预报准确率提升约7%
阿里巴巴时序预测联赛(ATFL)-- 167支参赛队
7. 预测算法研发路线
电商供应链场景的难点&挑战
- 营销活动多变,玩法不断推陈出新
- 新品、换代、清滞等人工决策
- 季节性 + 地域差异
- 商品替代性&关联性
- 供给侧影响:censored demand
8. 核心能力:新零售细分场景与解决方案
• 基于细分新零售场景(促销、替代品、季节品、新品)设计算法方案
促销品
针对直播场景,构建直播预测算
法,预测by仓销量、单量、GMV,
准确率60+%,支持直播供应链计
划产品
替代品
根据消费者点击行为序列,构建
商品替代关系embedding 季节品
通过算法拆解趋势、活动影响,
提取季节性指数
插入Falcon算法,预测准确率
(MAPE)提升4% 通过data augmentation(淘系
类目)获取更稳定的季节性信息
9. 2018/11/11
2018/11/12
2018/11/13
2018/11/14
应用案例1:大促爆品预包下沉
业务痛点:
•
•
促前:单量低需要少,人力闲置
促后:单量过高,需要大量临时人力,成本飚高,发货时效慢
业务效果:
• 人员成本降低XXX万人日,总成本节省超X千万
10. 应用案例2:直播预测