内容分发场景的多目标架构实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 内容分发场景的多目标架构实践 马臻 腾讯资深架构工程师
2.
3. 马臻 • 高级工程师 2018年加入腾讯,先后参与了粗排、精排、深度召回、特征中心、画像系统、样本 Pipeline 的建 设 • 主要从事信息流推荐工程架构
4.  QQ看点推荐场景介绍和业务挑战 多目标迭代架构实践  • 架构演进和多目标架构介绍 • 样本 Pipeline • 特征中心 • 在线实验
5. QQ看点推荐场景介绍和业务挑战 广场: feeds流图文、视频推荐 图文详情页:图文正文,相关推荐 视频沉浸式:沉浸式短视频、长视频 关注 关注流推荐:推荐关注 up 主发布的内容 点赞 好友推荐:推荐好友点赞过的内容 评论 账号推荐:推荐可能喜欢的 up 主 分享 投币 账号推荐 弹幕
6. QQ看点推荐场景介绍和业务挑战 推荐系统实时性如何提高? 如何从全链路提升多目标的开发、实验效率? 如何降低样本 Pipeline 的开发成本? 关注 召回、粗排、精排如何快速目标对齐? 点赞 推荐能力如何跨场景复用? 评论 如何提高性能,降低成本? 分享 投币 账号推荐 弹幕
7. QQ看点推荐场景介绍和业务挑战   多目标迭代架构实践 • 架构演进和多目标架构介绍 • 样本 Pipeline • 特征中心 • 在线实验
8. 多目标迭代架构实践 – 架构演进 MMOE Baseline CTR+时长 XGB/LR 排序模型 2018.04 调参平台 取得线上收益 开始探索 多目标架构 2019.06 DeepFM Baseline上线 2019.10 中台化 改造和推广 2020.06 2020.09 2021.08 通用信息流 样本Pipeline 排序优化 60%成本 排序实验效率 提升7倍 应用到十多 个推荐场景
9. 多目标迭代架构实践 – 多目标迭代要素 样本 • 样本多目标 Label 灵活定义 • 样本回跑 • 样本Pipeline跨场景复用 特征 • 特征接入、共享、迭代、治理 • 特征一致性保障 A/B 实验 • 缩短实验周期 • 增加并行实验数量 模型 • 召回、粗排、精排目标对齐 • TB 级模型的快速训练和上线
10. 多目标迭代架构实践 – 多目标架构介绍 • 统一样本 Pipeline • 特征中心 • 排序 Proxy • 业务重排网关 • 无量平台
11. 多目标迭代架构实践 – 样本Pipeline设计 • 接入层统一样本协议,屏蔽不同推荐场景的样本差异 • 通用实时拼接提供跨场景复用的实时样本能力 • 插件化设计提供灵活性、可扩展性
12. 多目标迭代架构实践 – 样本Pipeline模块 • Pipeline 的五个组件 o 接入层 o Flink 实时样本拼接 o 样本离线回跑组件 o 样本插件 o 样本分析系统
13. 多目标迭代架构实践 – 实时样本拼接 • 样本实时性 o 固定时间窗 o 样本粒度实时输出 o 样本粒度实时输出(首次)+ 固定时间窗(二次) o 刷粒度实时输出 • 通用性设计 o 独立于训练框架的样本格式 o 多条行为流 Union Join o 把 Label 定义放到下游插件
14. 多目标迭代架构实践 – 实时样本拼接 • 性能优化 o 单场景特征量 数十T/h,行为流水量 数十万/s o 通过 KeyedCoProcessFunction 实现四种输出机制 o 用户特征合并上报,特征现场 Snappy 压缩 o 对大流量场景使用索引减少特征现场HBase读请求,充分利用 RocksDB BlockCache o 拼接阶段用户特征的写扩大问题(KeyBy UserID+ItemID) 小流量场景 大流量场景
15. 多目标迭代架构实践 – 插件式样本生成 • 面向场景的样本开发:使用一份场景样本生成召回、粗排、精排样本 • 插件化设计:可扩展的样本系统,灵活支持多目标、多训练平台 • 上下游目标对齐:统一召回、粗排、精排特征抽取配置和Label定义接口 • 样本版本化治理:所有样本插件大仓管理,全量前 CR 机制,降低沟通成本
16. 多目标迭代架构实践 – 特征中心 • 特征接入:标准格式配置上线,非标准格式编写 Adapter 插件适配 • 特征跨场景共享、迭代加速:一次接入,多场景复用 • 特征治理能力:统一管理元信息,完善监控,责任到人
17. 多目标迭代架构实践 – 特征中心 • 功能:屏蔽下游异构存储,向调用方提供统一特征协议 • 组件:Manager 管理特征和集群,Serving 提供线上查询 • 业务隔离:Serving 分集群设计
18. 多目标迭代架构实践 – 样本回跑 • 通过离线回跑,缩短实验周期 • 通过同一份代码和配置确保特征一致、样本一致
19. 多目标迭代架构实践 – 样本分析系统 • Trace:样本、特征粒度的 case 分析 • 监控:样本波动告警,Label 分布告警 • 分析:通过样本宽表进行 SQL 分析 • 治理:特征重要度报告
20. 多目标迭代架构实践 – 在线实验 • 缩短实验周期 o 调参平台:根据线上指标自动调整参数 o 统一特征、样本系统:通过统一平台提效、能力复用 • 增加并行实验数量 o 实验职能收拢:由业务网关和 A/B 系统进行管理、配置、治理 o 推荐能力模块化:业务网关通过请求协议对推荐流程进行编排、配置
21. 多目标迭代架构实践 – 总结 推荐能力复用 推广到十多个推荐场 景各场景核心指标显 著提升 实验提效 线上并行数百个模型实验 样本实验 由10+条样本实验增加到上百条 样本迭代时间从1-5天缩减到分钟级 成本缩减 排序模块缩减60%成本 特征中心 特征中心接入数千特征
22. 欢迎关注腾讯看点技术公号
23.
24.

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.3. UTC+08:00, 2024-11-25 09:53
浙ICP备14020137号-1 $访客地图$