营销多场景联合排序建模技术
如果无法正常显示,请先停止浏览器的去广告插件。
1. 营销多场景联合建模技术
阿里巴巴集团 沈琪杰(朔杨)
2. 旅行场景下的个性化营销平台揭密
■ 背景
■ 个性化营销平台架构
■ 个性化投放
■ 用户建模
■ 流量调控
■ 多场景联合建模技术
3. 背景
4. 背景
5. 挑战和难点
• 投放⻚面模块多样化
• 投放物料多种异构数据源
• 运营干预配置多样化
• 如何统一个性化投放模型来赋能提效
6. 旅行场景下的个性化营销平台揭密
■ 背景
■ 个性化营销平台架构
■ 个性化投放
■ 用户建模
■ 流量调控
■ 多场景联合建模技术
7. 架构设计-场景抽象
入口
单物料投放
单tab场景
多物料混投
多tab场景
LBS推荐
胶囊 主题榜单
周边推荐 实时热榜
8. 架构设计-功能抽象
商品 酒店 内容 玩法 目的地
主题 榜单 店铺 优惠券 景点
商圈
POI
召回 个性化召回 弱个性化召回 冷启动召回 热⻔召回 触发式召回
排序 CTR GMV 人气 销量 距离
加权 物料 卖家 类目 目的地 TAB
打散 目的地 卖家 类目 店铺 商圈
定坑 物料 目的地 类目 TAB 所⻅即所得
9. 架构设计-链路抽象
10. 架构设计-个性化投放
11. 架构设计-用户建模
12. 架构设计-全域流量调控
PID参数周期计算
PID调控
中台
P/I/D参数调整
二次调整
PID-SCORE计算
误差计算更新
定时器
(小时/分钟)
分钟任务更新
pkey pidScore
item/cate/
dest/seller 流量调控因子
小时任务更新
调控商品
配置中心
⻜猪 TT日志流
skey
item/cate/ time-
dest/seller stamp
Blink实时曝光计算
实时流计
算中心
手淘 TT日志流
Matc
个性化场景
pkey
iGraph
Rank
支付宝 TT日志流
pv
实时
pv
实时调控看板
13. 架构设计-整体方案
14. 旅行场景下的个性化营销平台揭密
■ 背景
■ 个性化营销平台架构
■ 个性化投放
■ 用户建模
■ 流量调控
■ 多场景联合建模技术
15. 多场景联合建模技术
挑战
1、场景多,且数据分布差异大,若为每个场景独立维护模型代价大,且⻓尾场景数据量不足以训练一个鲁棒的模型
2、为了确保促销期间某些重要商家和商品的流量的确定性,重排阶段会有人工干预来调整排序结果,使得真实的曝光流量偏向于那些
被干预的商家或商品
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
16. 多场景联合建模技术
Scenario-Aware Ranking Network (SAR-Net)
Bias Adapting Loss
Fairness Coefficient
Scenario 2
Prediction
Scenario 1
Prediction
Output Value
Multi-Scenario Gate
Specific Experts
Cross-Scenario Behavior Extract Layer
Debias Expert Net
Scenario N
Prediction
....
Debias
Expert Net
Bias Net
Shared Experts
Debias
Expert Net
....
Debias
Expert Net
Debias
Expert Net
Scenario-Specific Tranform Layer
Scenario-Specific Transform Layer
Debias
Expert Net
....
Debias
Expert Net
Main Net
FC Layer FC Layer
BN BN
Scenario-N transform
...
Scenario-2 transform
Scenario-1 transform
Feed-Forward Attention
Mixture of Debias Experts
Activation Weight
Cross-Scenario
Behavior Extract
Layer
Weighted
Sum Pooling
Scene Specific Transform Layer
Fully Connected
Layer
X
Feed-Forward
Attention
Multi-Gate Network & Prediction
Feed-Forward
Attention
Out
Product
....
Bias Adapting Loss
Embedding Layer
X
Element-Wise Product
....
Concatenate
Bias Features
User Basic Profiles
(Fairness Coefficient)
User Behavior Sequence
Scenario Context Features
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
Target Item Features
Sum Operator
17. 多场景联合建模技术
18. 多场景联合建模技术
Cross-Scenario Behavior Extract Layer
现有的多场景建模方法将数据独立开来,未考虑用户在不同场景下的兴趣转移。事实上,大部分用户在多个场景中都有丰富的
行为,且对不同的场景有不同的偏好。例如,在旅游周边主题场景中,用户更喜欢景点门票等项目,而在亲子主题场景中,用
户更喜欢生活质量更高或适合孩子玩耍的项目,而在情侣旅游主题场景中,浪漫的风景和旅游体验将成为首要考虑因素。因
此,为了反映用户在不同场景下的重要出行意愿,刻画用户的兴趣转移,对用户跨场景行为进行建模是非常关键的。用户的跨
场景行为可以分为两部分,行为商品序列 p (B i ) = { p i 1 , p i 2 , ⋯, p i
} ,场景上下文序列
i
p (B )
p (B s ) = { p s 1 , p s 2 , ⋯, p i
},
p ik = [ e itemId | | e destination | | e category | | ⋯], p sk = [ e scenarioId | | e scenarioType | | e behaviorTime | | ⋯] 。我们定义
p (B s )
α k i , α k s ,分别表示用户行为商品和目标商品,历史行为状态和当前状态之间的相关性,如下所示:
α k i =
α k s =
最终得到用户的跨场景兴趣迁移:
exp(ψ(p ik , p it ))
p
(B i )
∑ l=1
exp(ψ(p il , p it ))
exp(ψ(p sk , p st ))
p (B s )
∑ l=1
v cb =
Bias Adapting Loss
Scenario 2
Prediction
Scenario 1
Prediction
Output Value
Multi-Scenario Gate
Specific Experts
Debias
Expert Net
Bias Net
Shared Experts
Debias
Expert Net
....
Debias
Expert Net
Debias
Expert Net
Scenario-Specific Tranform Layer
Debias
Expert Net
....
Debias
Expert Net
Main Net
FC Layer FC Layer
BN BN
Scenario-N transform
...
Scenario-2 transform
Scenario-1 transform
exp(ψ(p sl , p st ))
Feed-Forward Attention
Activation Weight
Cross-Scenario
Behavior Extract
Layer
Weighted
Sum Pooling
Scene Specific Transform Layer
Fully Connected
Layer
X
t
α k i * α k s * p ik
∑
k=1
Debias Expert Net
Scenario N
Prediction
....
Feed-Forward
Attention
Feed-Forward
Attention
Out
Product
....
Embedding Layer
X
Element-Wise Product
....
Concatenate
Bias Features
User Basic Profiles
(Fairness Coefficient)
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
User Behavior Sequence
Scenario Context Features
Target Item Features
Sum Operator
19. 多场景联合建模技术
Scenario-Specific Transform Layer
在生成用户兴趣转移向量 v cb 、用户画像向量 v u 、候选商品特征向量 v ti ,和场景上下文特征向量 v s 之后,我们可以通过连接相应的
特征嵌入向量来获得收集的表示 v = [ v cb | | v u ] | | v ti | | v s ] 。接下来,为了进一步提取场景感知的特定信息,我们应用一个场景转换
模块来处理前面的表示 v 。具体来说,对于i场景,我们计算 v' ,如下所示:
v' = v ⊗ β i + γ i
Bias Adapting Loss
Scenario 2
Prediction
Scenario 1
Prediction
Debias Expert Net
Scenario N
Prediction
....
Output Value
Multi-Scenario Gate
Specific Experts
Debias
Expert Net
Bias Net
Shared Experts
Debias
Expert Net
....
Debias
Expert Net
Debias
Expert Net
Scenario-Specific Tranform Layer
Debias
Expert Net
....
Debias
Expert Net
Main Net
FC Layer FC Layer
BN BN
Scenario-N transform
...
Scenario-2 transform
Scenario-1 transform
Feed-Forward Attention
Activation Weight
Cross-Scenario
Behavior Extract
Layer
Weighted
Sum Pooling
Scene Specific Transform Layer
Fully Connected
Layer
X
Feed-Forward
Attention
Feed-Forward
Attention
Out
Product
....
Embedding Layer
X
Element-Wise Product
....
Concatenate
Bias Features
User Basic Profiles
(Fairness Coefficient)
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
User Behavior Sequence
Scenario Context Features
Target Item Features
Sum Operator
20. 多场景联合建模技术
User Behavior Sequence
Scenario Context Features
Target Item Features
Sum Operator
21. 多场景联合建模技术
User Behavior Sequence
Scenario Context Features
Target Item Features
Sum Operator
22. 多场景联合建模技术
Bias Adapting Loss
为了缓解干预偏差问题,我们提出了公平系数的概念来衡量每个样本的重要性,并希望所提出的模型能够从具有高公平系数的样
本中获得更多信息,因为这些类型的样本较少受到干预。我们在考虑公平系数的情况下使用交叉熵损失函数,定义如下:
Loss =
|L k |
∑
l=1
i,k
w fairness
* loss k,l,j .
i,k
loss k,l,j 是场景k和项目i的第l个样本, w fairness
是场景k和项目i的公平系数, loss k,l,j 的计算如下:
loss k,l,i = − I k,l,i log p k,l,i − (1 − I k,l,i )log(1 − p k,l,i )
其中, p k,l,i 是SARNet的输出, I k,l,i 是场景s和项目i的第个l样本的标签, I k,l,i = 1 表示该条样本为正样本,即被点击。
Bias Adapting Loss
Scenario 2
Prediction
Scenario 1
Prediction
Debias Expert Net
Scenario N
Prediction
....
Output Value
Multi-Scenario Gate
Specific Experts
Debias
Expert Net
Bias Net
Shared Experts
Debias
Expert Net
....
Debias
Expert Net
Debias
Expert Net
Scenario-Specific Tranform Layer
Debias
Expert Net
....
Debias
Expert Net
Main Net
FC Layer FC Layer
BN BN
Scenario-N transform
...
Scenario-2 transform
Scenario-1 transform
Feed-Forward Attention
Activation Weight
Cross-Scenario
Behavior Extract
Layer
Weighted
Sum Pooling
Scene Specific Transform Layer
Fully Connected
Layer
X
Feed-Forward
Attention
Feed-Forward
Attention
Out
Product
....
Embedding Layer
X
Element-Wise Product
....
Concatenate
Bias Features
User Basic Profiles
(Fairness Coefficient)
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
User Behavior Sequence
Scenario Context Features
Target Item Features
Sum Operator
23. 多场景联合建模技术
离线实验
选择飞猪双十一期间飞猪、支付宝、淘宝三端中20个主要场景做离线实验,下图为每个场景的数据分布情况,和用户的
行为分布情况
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
24. 多场景联合建模技术
离线实验
1、混合场景模型的总体性能比单一场景模型和多场景模型差,这证明模糊
场景差异会损害多场景CTR预测的建模。此外,HPS、Cross-stitch、
MMOE、CGC和PLE都实现了更好的整体性能,证明了利用场景之间的区
别和关系的重要性。
2、尽管单一场景方法的性能都优于混合场景方法,但在场景#18中,单一
场景方法的AUC比混合场景方法差。我们推断这是因为场景#18的数据占训
练数据集的0.15%,不足以训练一个合理的模型,而混合场景方法有足够的
数据进行训练。
3、在场景#8中,以单一场景方式训练的DIN模型比HPS、Cross Stitch、
MMOE、CGC和PLE具有更好的性能,这与整体性能结果相反,它表明在
某些场景中,现有的多任务模型无法提取关于场景和用户的更深层信息。
4、SAR网络在所有场景中都表现出稳定的性能。此外,与HPS、
Cross Stitch、CGC和PLE相比,SAR网络也取得了一致的改进,这表明了显
式建模用户兴趣转移和提取场景特定信息的优势
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
25. 多场景联合建模技术
消融实验(Cross-Scenario Behavior Extract Layer)
Base表现最差,这表明有用的信号很容易被隐藏在噪声中而无需提取。
此外,与基础模型相比,目标项目注意或情景注意都可以提高AUC,表
明考虑目标项目或情景上下文信息的相关性都可以带来收益。考虑目标
项目和场景上下文特征的第三和第四注意机制比基础模型执行得更好,
但比目标关注更差,这意味着直接连接目标项目和场景上下文特征作为
key不能完全挖掘并利用有用信息。相比之下,SAR-Net分别从目标项和
场景上下文的角度学习注意权重,获得了最好性能。结果表明,分别学
习权重可以避免相互干扰,并且可以提取不同场景下用户的兴趣转移。
Target attention:将目标商品作为query,行为商品作为ke
Scenario attention:以场景上下文特征为query,以行为发生时的场景上下文信息为ke
Concatenate attention:将目标商品和场景上下文concatenate起来作为quer
Hieraechical attention:使用两层网络。在第一层中,与目标项连接的场景上下文特征用作query。在第二
层中,场景上下文特性用作query。将两个注意层的权重相乘,生成最终的汇聚权重
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
26. 多场景联合建模技术
消融实验(Bias Net and Bias Adapting Loss)
当对被干预商品进行下采样时,性能先略有改善,然后有所下降。当
子采样率为0.7时,性能最好。这是因为下采样将减少数据集中干预项
的比例,以便模型能够以更公平的方式学习每种类型项的信息。但
是,当比例逐渐降低时,模型的性能会下降,表明过多的次抽样导致
样本的减少,用户与项目之间的交互信息没有得到充分利用。与base和
下采样方法相比,在每个专家网络中引入偏差网络,对专家在训练过
程中的预测进行重新加权,可以获得更好的性能。此外,偏差适应损
失可以使模型适应干预数据,并根据样本的重要性学习信息。我们设
计的同时具有偏置网络和偏置自适应损耗的SAR网络可以进一步提高
性能,证明了偏置自适应损耗和偏置网络的有效性及其互补性。
1)对人工干预而过度曝光的商品下采样。采样率分别为0.9,0.8,0.7,0.6;
2) 将偏差网络引入专家网络;
3) 利用偏置自适应损失;
4)使用偏置网络和偏置自适应损失。
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
27. 多场景联合建模技术
消融实验(Scenario-Speci c Transform Layer)
场景特定转换层通过加强不同场景的关键信息,进一步建模场景之间的
差异和关系。在本节中,我们以移除场景转换层的SARNet为base,考
虑以下设置:1)参考PLE,采用多层专家网络提取特征。层数分别设
置为2、3、4、5;2)采用单层专家网络,在专家网络(SAR网络)前
增加场景转换层。从表6可以看出,随着层数的增加,多层提取网络结
构的效益逐渐收敛。与多层专家提取结构相比,场景特定变换层以较少
的参数获得了更好的结果。
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
28. 多场景联合建模技术
在线实验
线上实验7天,base模型为MMOE,其中线上实验对长尾流量场景进行合并。实验结果如图所示。很明显,SARNet的性能稳定优
于base,证明了所提模型在实际多场景CTR任务中的有效性。
此外,我们还分析了模型在不同类别下的性能,并与base模型相比,我们发现:1)SARNet使各类别的曝光率更加均匀;
2) SAR网络在所有类别中都实现了稳定提升;3)流量占比较小的类别提升更明显。这些结果表明,SAR-Net有效地缓解了干预
偏差问题,并实现了每个商品的公平推荐。
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
29. 多场景联合建模技术
总结
在本文中,我们提出了一种新的场景感知排序网络,以解决阿里巴巴旅行营销平台中遇到的两个问题,即多场景建模问题和干预
偏差问题。SAR-Net通过两个特定的注意模块学习用户的跨场景兴趣,从不同场景中获取丰富的数据。然后,采用场景特定的转
换层进一步提取场景特定的特征,然后使用两组debias专家网络。此外,上述中间结果通过多场景选通模块融合到最终结果中。
此外,我们还提出了公平系数的概念来衡量单个样本的重要性,并将其用于重新加权debias专家网络中的预测。在离线数据集和
在线A/B测试上的实验结果表明,SAR网络在多场景预测方面有稳定的性能提升。在未来,我们打算研究引入更多用户细粒度行
为的影响。
Email: qijie.sqj@alibaba-inc.com
Wechat: Ezail_Ju
Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021
30. 谢谢大家观看~