内容分发场景的多目标架构实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 内容分发场景的多目标架构实践
马臻
腾讯资深架构工程师
2.
3. 马臻
•
高级工程师
2018年加入腾讯,先后参与了粗排、精排、深度召回、特征中心、画像系统、样本 Pipeline 的建
设
•
主要从事信息流推荐工程架构
4. QQ看点推荐场景介绍和业务挑战
多目标迭代架构实践
• 架构演进和多目标架构介绍
• 样本 Pipeline
• 特征中心
• 在线实验
5. QQ看点推荐场景介绍和业务挑战
广场: feeds流图文、视频推荐
图文详情页:图文正文,相关推荐
视频沉浸式:沉浸式短视频、长视频
关注 关注流推荐:推荐关注 up 主发布的内容
点赞 好友推荐:推荐好友点赞过的内容
评论 账号推荐:推荐可能喜欢的 up 主
分享
投币
账号推荐
弹幕
6. QQ看点推荐场景介绍和业务挑战
推荐系统实时性如何提高?
如何从全链路提升多目标的开发、实验效率?
如何降低样本 Pipeline 的开发成本?
关注 召回、粗排、精排如何快速目标对齐?
点赞 推荐能力如何跨场景复用?
评论 如何提高性能,降低成本?
分享
投币
账号推荐
弹幕
7. QQ看点推荐场景介绍和业务挑战
多目标迭代架构实践
• 架构演进和多目标架构介绍
• 样本 Pipeline
• 特征中心
• 在线实验
8. 多目标迭代架构实践 – 架构演进
MMOE
Baseline
CTR+时长
XGB/LR
排序模型
2018.04
调参平台
取得线上收益
开始探索
多目标架构
2019.06
DeepFM
Baseline上线
2019.10
中台化
改造和推广
2020.06
2020.09
2021.08
通用信息流
样本Pipeline 排序优化
60%成本
排序实验效率
提升7倍 应用到十多
个推荐场景
9. 多目标迭代架构实践 – 多目标迭代要素
样本
• 样本多目标 Label 灵活定义
• 样本回跑
• 样本Pipeline跨场景复用
特征
• 特征接入、共享、迭代、治理
• 特征一致性保障
A/B 实验
• 缩短实验周期
• 增加并行实验数量
模型
• 召回、粗排、精排目标对齐
• TB 级模型的快速训练和上线
10. 多目标迭代架构实践 – 多目标架构介绍
• 统一样本 Pipeline
• 特征中心
• 排序 Proxy
• 业务重排网关
• 无量平台
11. 多目标迭代架构实践 – 样本Pipeline设计
• 接入层统一样本协议,屏蔽不同推荐场景的样本差异
• 通用实时拼接提供跨场景复用的实时样本能力
• 插件化设计提供灵活性、可扩展性
12. 多目标迭代架构实践 – 样本Pipeline模块
• Pipeline 的五个组件
o 接入层
o Flink 实时样本拼接
o 样本离线回跑组件
o 样本插件
o 样本分析系统
13. 多目标迭代架构实践 – 实时样本拼接
• 样本实时性
o 固定时间窗
o 样本粒度实时输出
o 样本粒度实时输出(首次)+ 固定时间窗(二次)
o 刷粒度实时输出
• 通用性设计
o 独立于训练框架的样本格式
o 多条行为流 Union Join
o 把 Label 定义放到下游插件
14. 多目标迭代架构实践 – 实时样本拼接
• 性能优化
o 单场景特征量 数十T/h,行为流水量 数十万/s
o 通过 KeyedCoProcessFunction 实现四种输出机制
o 用户特征合并上报,特征现场 Snappy 压缩
o 对大流量场景使用索引减少特征现场HBase读请求,充分利用 RocksDB BlockCache
o 拼接阶段用户特征的写扩大问题(KeyBy UserID+ItemID)
小流量场景
大流量场景
15. 多目标迭代架构实践 – 插件式样本生成
• 面向场景的样本开发:使用一份场景样本生成召回、粗排、精排样本
• 插件化设计:可扩展的样本系统,灵活支持多目标、多训练平台
• 上下游目标对齐:统一召回、粗排、精排特征抽取配置和Label定义接口
• 样本版本化治理:所有样本插件大仓管理,全量前 CR 机制,降低沟通成本
16. 多目标迭代架构实践 – 特征中心
• 特征接入:标准格式配置上线,非标准格式编写 Adapter 插件适配
• 特征跨场景共享、迭代加速:一次接入,多场景复用
• 特征治理能力:统一管理元信息,完善监控,责任到人
17. 多目标迭代架构实践 – 特征中心
• 功能:屏蔽下游异构存储,向调用方提供统一特征协议
• 组件:Manager 管理特征和集群,Serving 提供线上查询
• 业务隔离:Serving 分集群设计
18. 多目标迭代架构实践 – 样本回跑
• 通过离线回跑,缩短实验周期
• 通过同一份代码和配置确保特征一致、样本一致
19. 多目标迭代架构实践 – 样本分析系统
• Trace:样本、特征粒度的 case 分析
• 监控:样本波动告警,Label 分布告警
• 分析:通过样本宽表进行 SQL 分析
• 治理:特征重要度报告
20. 多目标迭代架构实践 – 在线实验
• 缩短实验周期
o 调参平台:根据线上指标自动调整参数
o 统一特征、样本系统:通过统一平台提效、能力复用
• 增加并行实验数量
o 实验职能收拢:由业务网关和 A/B 系统进行管理、配置、治理
o 推荐能力模块化:业务网关通过请求协议对推荐流程进行编排、配置
21. 多目标迭代架构实践 – 总结
推荐能力复用
推广到十多个推荐场
景各场景核心指标显
著提升
实验提效
线上并行数百个模型实验
样本实验
由10+条样本实验增加到上百条
样本迭代时间从1-5天缩减到分钟级
成本缩减
排序模块缩减60%成本
特征中心
特征中心接入数千特征
22. 欢迎关注腾讯看点技术公号
23.
24.