百胜中国--即时配送平台数字化演进
如果无法正常显示,请先停止浏览器的去广告插件。
1. 百胜中国 – 即时配送平台数字化架构演进
卢辰宏
百胜中国-数字化研发中心
即时配送平台架构师
2.
3. 自我介绍
卢辰宏
• 12年互联网从业
• 6年千万级DAU项目 架构师/项目负责人
• 电商平台领域/内容平台领域/配送平台领域
• 2021年加入百胜中国数字化研发中心,负责即时配送平台、
业务架构演进
4. 前言-百胜中国数字化研发中心
大前端
门店运营
智能外送
大数据
数字化研
发中心
上海
人工智能
供应链
管理
中台
南京
数据智能
基础架构
数字化餐饮云服务
西安
…
5. 前言-百胜中国数字化生态
6. 前言-即时配送平台简介
餐厅
对餐厅来说,即时配送平台完成的是“最
后一公里”,是整个外送业务的最后一
环。餐厅制作完餐之后,将餐品给到骑
手,并通过餐厅APP完成结算。
骑手
骑手完成的是“履约”,智能也主要用于
骑手,根据骑手APP获得被指派后的订单
信息,到餐厅取餐后根据APP的路线规划
送到用户手里。
用户
用户“准时”收到骑手送到的餐点
7. 目录
1
2
3
添加标题
即时配送平台架构演进史
添加标题
即时配送平台工业化架构
添加标题
即时配送平台未来架构展望
8. 即时配送平台架构演进史
人工配送架构
1.0
2003年左右,配送业务的产生的初时,百胜是如何
在当时的背景下,完成业务的?
数字化架构
2.0
2010年左右,随着技术的叠新,我们有机会将业务
翻倍,人工被替换成了数字化系统。
智能架构
3.0
2016年左右,随着业务发展越来越迅速,传统的架
构已经无法满足诉求,智能配送应运而生。
工业化架构
4.0
2022年,海量订单、海量骑手、海量服务。业务的
发展对架构的要求更加严格,我们将目光移向了云上。
9. 演进史-人工配送1.0
业务背景 技术背景 架构 痛点
外送诉求 互联网起步 人工配送 人工/履约难
彼时,主流的用餐方式是
堂食,但也有少部分用户
希望家中用餐。
随着400电话的兴起,让
外送业务可以开始推广。
• 400电话普及
• 微机时代
• 互联网萌芽
呼叫中心 Telnet
人工录入POS 店员配送
人工扫街 每日结款
•
•
•
•
•
•
效率低下:
接线员N*M餐厅
配送地址:人工扫街
(大的POI点)的精细
度,和覆盖范围
派单员
人工错漏
支付收款:货到付款对
骑手的管理要求更高
了,现金管理的风险
10. 演进史-数字化配送2.0
•
•
•
•
•
•
业务背景 技术背景 架构 痛点
做更多生意 互联网爆发 数字化配送 配送/骑手管理
效率低下:
接线员N*M餐厅
配送地址:人工扫街
(大的POI点)的精细
度,和覆盖范围
派单员
人工错漏
支付收款:货到付款
对骑手的管理要求更
高了,现金管理的风
险
外送
品牌
• 派单难度增加:更多订
单,更多地址,更多的骑
手
SVN • 骑手的管理:骑手的位
置,状态
虚拟机 • 配送成本、配送效率:指
派是否合理?骑手是否高
效?
• 稳定性:餐厅/骑手的使用
外送系统
•
线上支付
入口层
• 线上地图
• PC/H5
DNS
NG
下单 商圈/调度
选店/支付 餐厅/骑手管理
服务层
自研打包发布
存储
SQLLite
11. 演进史-智能配送3.0
业务背景
架构
技术背景
外送
品牌
外送诉求
智能物流平台
移动/智能
前端
系统
•
•
•
•
派单难度增加:更
多订单,更多地
址,更多的骑手
骑手的管理:骑手
的位置,状态
配送成本、配送效
率:指派是否合
理?骑手是否高
效?
稳定性:餐厅/骑手
的使用
openAPI
骑手APP
…
餐厅APP
运营平台
DNS
•
•
•
•
订单服务
移动端兴起
微服务架构
调度/爆单
离线预估
骑手/餐厅
运营平台
公共服务
LVS
中台
层
接单 实时调度 出餐时间预估 订单管理 餐厅骑手管理 极光推送
物流订单查询 爆单预估 运力预估 骑手餐厅上报 业务指导 高德服务
物流状态查询 ETA预估 交付时间预估 骑手实名认证 业务数据统计 日志服务
FlowCTL
智能时代
NG
大数据
uproxy
中间件
Kakfa
Mysql
ES
Redis
jenkins
注册发现
大数据
HIVE
Impala
HBase
Kylin
Hadoop
12. 演进史-3.0的新痛点
痛点
稳定/发展
1.0人工
2.0规则
3.0智能
4.0工业化
• 功能服务膨胀:语言栈
与技能不符、迭代难、
产出少、定制化严重
• 算法演进难:排障困
难、中间数据缺失、验
证周期长、业务有损
• 开发运维协同成本:迭
代慢、产出少,瀑布模
型跟不上业务诉求,大
量精力在流程协同
• 越发重要的稳定性:到
处漏水的网络节点、容
灾能力不足、中间件的
瓶颈提前到来
13. 演进史-工业化4.0要点
稳定性:99.995%
便捷性:高效研发、低成本维护
灵活性:面向领域、高复用、快速试错
注:稳定性指标计算公式为 全年系统故障时长/全年提供服务的时长,99.995%的目标意味着全年的故障时长不能超过26分钟
14. 4.0-99.995%稳定性
15. 4.0-99.995%稳定性-设计原则
感知++
自动化容灾
逃生路径
16. 4.0-99.995%稳定性-感知++
发生故障
大片告警
查看告警和监控
10m-60m
传统感知
故障解除
分析原因
解决问题
找到跟因
17. 4.0-99.995%稳定性-感知++
发生故障 关键告警 执行预设备案
查看告警和监控 分析原因 找到跟因
故障排除
逃生路径++
排查路径++
解决问题
备案恢复
18. 4.0-99.995%稳定性-自动化容灾
流控组件
VIP
操盘手
Flow CTL备
Flow CTL主
99.995%稳定性-自动化容灾
全自动容灾
公有云A
监控告警中心
公有云B
公有云C
操盘手 监控采集
展示 网关 注册发现 网关 注册发现 网关 注册发现
打通监控 告警配置 订单 骑手 订单 骑手 订单 骑手
植入备案 告警触达 算法 运营 算法 运营 算法 运营
自动执行
办公软件
19. 4.0-99.995%稳定性-逃生路径
99.995%稳定性-数据容灾
主从自动切换
公有云A 公有云B 公有云C
服务组 服务组 服务组
公有云数据层 公有云数据层 公有云数据层
MQ
Redis
MQ
Redis
MQ
Redis
SONIC
自动降级
S级中心化数据层
DBproxy
自动补偿
DBproxy
DBproxy
ZK
最终一致性
Mysql主
Mysql从
Mysql从
Mysql从
Mysql从
Mysql从
缓存同步
DB主故障补偿
Kafka/ES
补偿服务
A级中心化数据层
ES
Falcon
HIVE
HBASE
20. 4.0-研发提效
21. 4.0-研发提效
高效研发、低成本维护
公有云A 公有云B 公有云C
NGX NGX NGX
网关
无侵入监控和限流
无侵入ServiceMesh
无侵入中间件版本更迭
网关
网关
注册发现中心
注册发现中心
研发工作流
一键打包发布
代码检查、单元测试、安全检查
注册发现中心
Starter框架
Starter框架
Starter框架
CD 标准监控 标准日志 标准监控 标准日志 标准监控 标准日志
健康检查 Service
Mesh 标准中间
件 Service
Mesh 标准中间
件 Service
Mesh 标准中间
件
Keep
Alive 标准接入 Keep
Alive 标准接入 Keep
Alive 标准接入
GITEE CI 代码托管 Docker
Build 规范扫描 编译环境
集成 安全扫描
Code
Review 推送
Harbor 环境集成
单元测试 生成
Deploy 自动化用
例
容
量
管
理
业务服务 业务服务 业务服务
公有云数据层 公有云数据层 公有云数据层
Redis
MQ
Redis
MQ
Redis
中心化数据层
Mysql
ES
falcon
HIVE
HBASE
MQ
22. 4.0-面向领域、高复用、快速低成本试错
4
业务规则越来越复杂?微服务之间的边界越来越不清晰?
3
2
接口逻辑随着迭代变得不清晰,随意的封装和随意的调用
算法和业务糅合在一起提供服务,精通算法+工程才可维护
1
算法迭代只能线上流量验证效果,以月为周期的迭代
23. 4.0-面向领域、高复用、快速低成本试错
微服务Domain-Driven Design
高复用平台化模块
离线仿真效果验证
面向领域、高复用、快速低成本试错
算法中心
业务中心
订单
正向交易
逆向交易
多维查询
订单履历
租户
算法工程
业务分析中心
算法
离线仿真
DashBoard
租户APP
业务接入 任务管理 算法控制 爆单算法 调度算法 预估算法 仿真框架 模拟中心 数据中心 业务注册 Xxl-job 算法插座 模拟指派
算法 混合路径
规划 运力预估
算法 启动任务 订单模拟 订单记录 算法模型
选择 模型管理 ABTEST 历史经验
算法 并联分组
算法 送达预估
算法 终止任务 骑手模拟 骑手数据 履历平台
业务回调
注册 模型算法
转换 多算法协
同 虚拟距离
算法 空驶调度
算法 出餐预估
算法 仿真时段 天气模拟 模拟结果 运营平台
门店管理
订单操作
排班增值
口袋经理
时光机
数据平台
骑手 运营
骑手APP 订单管理
骑手考试 租户管理
骑手管理 骑手管理
增值报表 配置管理
数据中心
中间件&持久层
Mysql
Redis
ES日志
异步持久层
Hive
Hbase
日志
收集&推送
ES
TiDB
Flume
数仓
HDFS/Hive
Doris
Spark
Flink
Kafka
24. 未来-互联互通、技术嗅觉、动态治理
业务
业务系统,未知的未来
未来
互通互联、技术热情
从业务深挖痛点,技术嗅觉
工业化
智能
数字化
技术
人工
25.