推荐技术在 vivo 互联网商业化业务中的实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 推荐技术
在vivo互联网商业化业务中的实践
邵迪
vivo互联网技术总监
2.
3. • vivo互联网业务场景简介
• 推荐技术应用的挑战与突破
• 推荐技术在商业化业务实践
• 总结与展望
4. vivo不仅仅手机业务,也包含优质的互联网应用
vivo
APP商店日活 7056万
手机在网用户 2.8亿
游戏中心日活 1488万
浏览器信息流日活
9788万
i视频日活 1988万
数据截止2022年6月
5. vivo不仅仅手机业务,也包含优质的互联网应用
应用商店-首页推荐
游戏中心-首页推荐
浏览器-信息流推荐
联盟-底部banner
vivo短视频-内容推荐
6. vivo不仅仅手机业务,也包含优质的互联网应用
用户
AI算法支撑
业务创新适配
商业生态影响公司的市场立足
和发展
内容生态影响着品牌的口碑和
用户的留存
策略共建输出
平台
挑战与机遇并存
7. • vivo互联网业务场景简介
• 推荐技术应用的挑战与突破
• 推荐技术在商业化业务实践
• 总结与展望
8. 挑战一:同时支持几十个APP,上百个场景算法服务
丰富的生态应用,满足用户各类需求
视频
新闻
资讯
游戏
电子
书
极大考验推荐系统的平台能力
多
样
性 APP丰富带来需求多样、复杂
长
尾
多 除几款Top应用外,其它APP
搜索
音乐
商城
APP
商店
金融
Jovi
助手
类
体量难以形成规模效应
商业
产品 游戏联运、OCPC、CPD等商
复杂 业产品形态差异巨大
9. 挑战二:转化目标链路越来越深
关注深度转化目标的效果
付费
CVR
正例稀疏
深 核心关切
•
•
次留
激活、注册
下载
点击
CVR
浅 样本空间少
中短期兴趣
•
•
CTR
•
•
实时性高
空间大
10. 挑战三:如何度量技术效果
引入行业TOP团队作为对标标杆
vivo团队自研
基础数据组件 同步
数据
特征
机器学习平台 业务部门
中立
OKR:收入
HDFS、SPARK、MR、
HBASE、FLINK等
推荐系统
召回、粗排、精排
(CTR、CVR)、校准
根据
效果
分配
流量
比例
后验效果PK
(ARPU、CPM、
CVR、CTR)
标杆团队
基础组件
机器学习中台
推荐系统
召回、粗排、精排
(CTR、CVR)、校准
11. 推荐技术应用的挑战与突破
面对挑战,
面对机遇,
如何结合自身的后发优势,
从而取得阶段性突破?
统一推荐系统架构,落地行业算法,整体效果对齐行业标杆
12. 突破一:后发优势,构建统一推荐系统
13. 突破二: 商业化效果追平甚至超越行业标杆
14. • vivo互联网业务场景简介
• 推荐技术应用的挑战与突破
• 推荐技术在商业化业务实践
• 总结与展望
15. 推荐技术在商业化业务实践 | 整体推荐架构
16. 推荐技术在商业化业务实践 | 训练框架
17. 推荐技术在商业化业务实践 | 训练框架
参数服务器: 千亿级别
• 异步计算&同步计算&在离线同步
• 减少跨物理机通信
• 优化梯度震荡
•
梯度: � �
= � � � �
� � = � � 1 + � − �
�� 0, �
•
, � >= 1
动态数据分片,降低拖尾
�
18. 推荐技术在商业化业务实践 | 预估架构
分布式预估
• Feature Server独立 (8%+)
• Cross Ext-GPU (60%+)
• Pooling op-GPU (40%+)
• Pred-GPU (+25%~60%+)
• 实时模型&增量更新
CPU:80c
GPU:T4
19. 推荐技术在商业化业务实践 | 召回优化
重定义目标,提高系统一致性
基于曝光样本
建模
方案:简易精排模型
问题:目标多&深,难以同
精排对齐
基于精排队列
方案:一致性List-wise建模
建模
问题:场景多维护成本高;
深度转化稀疏拟合不充分
深度兴趣匹配
方案:多任务weighted-loss建模
建模
优势:兼顾场景+目标
提升稀疏目标贡献
20. 推荐技术在商业化业务实践 | 召回优化
建模
数据
•
•
•
指标
•
多场景联合建模
正样本:深度兴趣过采样 • 负样本:多维度+多策略 • Loss =
时效性:10分钟级 • 时效性:10分钟级
�
� �
�=1 � �
� � , � � , �: 场景数
•
离线:
• topN交集率
• NDCG@K
在线:NDCG@1000
21. 推荐技术在商业化业务实践 | CTR优化(精排模型)
建模
数据
•
•
多场景样本联合
各场景统计数据
指标
•
•
离线:
• AUC
• 分桶一致性
在线:
• 曝光点击率
• 人均请求点击率
• Wide & Deep
• Wide & 分场景Deep
• 时效性:10分钟
22. 推荐技术在商业化业务实践 | CVR优化(精排模型)
• 业务种类单一,目标较少
• 增加转化类型交叉
• 易于分析
目标越来越多,越来越精细
23. 推荐技术在商业化业务实践 | CVR优化(精排模型)
• 各目标网络独立
• 各目标个性化slot
• 丰富数据利于embedding学习
目标间的相关性关系对模型影响较大
24. 推荐技术在商业化业务实践 | CVR优化(精排模型)
• 信息提取更充分
• 个性化门控
• 各目标间更好的共享信息
• 更好的缓解目标相关性冲突
在离线计算量增加
25. • vivo互联网业务场景简介
• 推荐技术应用的挑战与突破
• 推荐技术在商业化业务实践
• 总结与展望
26. 总结与展望
总结
利用后发优势,通过构建统一的推荐系统应对多场景、多服务的问题
结合自身的场景业务特点,落地业内常见的多任务模型,解决目标多、链路深的问题
不断加强同标杆团队、业界其他兄弟团队的交流合作,优化整体算法+架构
27. 总结与展望
展望
vivo互联网技术公众号
图像、NLP等信息未直接参与到推荐技术的端
到端学习中,存在信息损失
个人微信
更好的运用知识推理、融合能力,推动更多的
迁移学习能力在vivo商业化落地
持续进行数据、算法优化,降低数据安全(隐
私)等问题对推荐系统的冲击影响
推荐系统框架C++工程师
不断探索改善用户体验与商业化变现能力的平
衡问题
推荐算法工程师
简历邮箱:di.shao@vivo.com
28.
29.
30. • Content Title 2
• Content Title 3
• Content Title 4
• Content Title 5
• Content Title 6
31.