营销多场景联合排序建模技术

如果无法正常显示，请先停止浏览器的去广告插件。

1. 营销多场景联合建模技术阿里巴巴集团沈琪杰（朔杨）

2. 旅行场景下的个性化营销平台揭密 ■ 背景 ■ 个性化营销平台架构 ■ 个性化投放 ■ 用户建模 ■ 流量调控 ■ 多场景联合建模技术

3. 背景

4. 背景

5. 挑战和难点 • 投放⻚面模块多样化 • 投放物料多种异构数据源 • 运营干预配置多样化 • 如何统一个性化投放模型来赋能提效

6. 旅行场景下的个性化营销平台揭密 ■ 背景 ■ 个性化营销平台架构 ■ 个性化投放 ■ 用户建模 ■ 流量调控 ■ 多场景联合建模技术

7. 架构设计-场景抽象入口单物料投放单tab场景多物料混投多tab场景 LBS推荐胶囊主题榜单周边推荐实时热榜

8. 架构设计-功能抽象商品酒店内容玩法目的地主题榜单店铺优惠券景点商圈 POI 召回个性化召回弱个性化召回冷启动召回热⻔召回触发式召回排序 CTR GMV 人气销量距离加权物料卖家类目目的地 TAB 打散目的地卖家类目店铺商圈定坑物料目的地类目 TAB 所⻅即所得

9. 架构设计-链路抽象

10. 架构设计-个性化投放

11. 架构设计-用户建模

12. 架构设计-全域流量调控 PID参数周期计算 PID调控中台 P/I/D参数调整二次调整 PID-SCORE计算误差计算更新定时器（小时/分钟）分钟任务更新 pkey pidScore item/cate/ dest/seller 流量调控因子小时任务更新调控商品配置中心⻜猪 TT日志流 skey item/cate/ time- dest/seller stamp Blink实时曝光计算实时流计算中心手淘 TT日志流 Matc 个性化场景 pkey iGraph Rank 支付宝 TT日志流 pv 实时 pv 实时调控看板

13. 架构设计-整体方案

14. 旅行场景下的个性化营销平台揭密 ■ 背景 ■ 个性化营销平台架构 ■ 个性化投放 ■ 用户建模 ■ 流量调控 ■ 多场景联合建模技术

15. 多场景联合建模技术挑战 1、场景多，且数据分布差异大，若为每个场景独立维护模型代价大，且⻓尾场景数据量不足以训练一个鲁棒的模型 2、为了确保促销期间某些重要商家和商品的流量的确定性，重排阶段会有人工干预来调整排序结果，使得真实的曝光流量偏向于那些被干预的商家或商品 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

16. 多场景联合建模技术 Scenario-Aware Ranking Network （SAR-Net） Bias Adapting Loss Fairness Coefficient Scenario 2 Prediction Scenario 1 Prediction Output Value Multi-Scenario Gate Specific Experts Cross-Scenario Behavior Extract Layer Debias Expert Net Scenario N Prediction .... Debias Expert Net Bias Net Shared Experts Debias Expert Net .... Debias Expert Net Debias Expert Net Scenario-Specific Tranform Layer Scenario-Specific Transform Layer Debias Expert Net .... Debias Expert Net Main Net FC Layer FC Layer BN BN Scenario-N transform ... Scenario-2 transform Scenario-1 transform Feed-Forward Attention Mixture of Debias Experts Activation Weight Cross-Scenario Behavior Extract Layer Weighted Sum Pooling Scene Specific Transform Layer Fully Connected Layer X Feed-Forward Attention Multi-Gate Network & Prediction Feed-Forward Attention Out Product .... Bias Adapting Loss Embedding Layer X Element-Wise Product .... Concatenate Bias Features User Basic Profiles (Fairness Coefficient) User Behavior Sequence Scenario Context Features Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021 Target Item Features Sum Operator

17. 多场景联合建模技术

18. 多场景联合建模技术 Cross-Scenario Behavior Extract Layer 现有的多场景建模方法将数据独立开来，未考虑用户在不同场景下的兴趣转移。事实上，大部分用户在多个场景中都有丰富的行为，且对不同的场景有不同的偏好。例如，在旅游周边主题场景中，用户更喜欢景点门票等项目，而在亲子主题场景中，用户更喜欢生活质量更高或适合孩子玩耍的项目，而在情侣旅游主题场景中，浪漫的风景和旅游体验将成为首要考虑因素。因此，为了反映用户在不同场景下的重要出行意愿，刻画用户的兴趣转移，对用户跨场景行为进行建模是非常关键的。用户的跨场景行为可以分为两部分，行为商品序列 p (B i ) = { p i 1 , p i 2 , ⋯, p i } ，场景上下文序列 i p (B ) p (B s ) = { p s 1 , p s 2 , ⋯, p i }, p ik = [ e itemId | | e destination | | e category | | ⋯], p sk = [ e scenarioId | | e scenarioType | | e behaviorTime | | ⋯] 。我们定义 p (B s ) α k i , α k s ，分别表示用户行为商品和目标商品，历史行为状态和当前状态之间的相关性，如下所示： α k i = α k s = 最终得到用户的跨场景兴趣迁移： exp(ψ(p ik , p it )) p (B i ) ∑ l=1 exp(ψ(p il , p it )) exp(ψ(p sk , p st )) p (B s ) ∑ l=1 v cb = Bias Adapting Loss Scenario 2 Prediction Scenario 1 Prediction Output Value Multi-Scenario Gate Specific Experts Debias Expert Net Bias Net Shared Experts Debias Expert Net .... Debias Expert Net Debias Expert Net Scenario-Specific Tranform Layer Debias Expert Net .... Debias Expert Net Main Net FC Layer FC Layer BN BN Scenario-N transform ... Scenario-2 transform Scenario-1 transform exp(ψ(p sl , p st )) Feed-Forward Attention Activation Weight Cross-Scenario Behavior Extract Layer Weighted Sum Pooling Scene Specific Transform Layer Fully Connected Layer X t α k i * α k s * p ik ∑ k=1 Debias Expert Net Scenario N Prediction .... Feed-Forward Attention Feed-Forward Attention Out Product .... Embedding Layer X Element-Wise Product .... Concatenate Bias Features User Basic Profiles (Fairness Coefficient) Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021 User Behavior Sequence Scenario Context Features Target Item Features Sum Operator

19. 多场景联合建模技术 Scenario-Specific Transform Layer 在生成用户兴趣转移向量 v cb 、用户画像向量 v u 、候选商品特征向量 v ti ，和场景上下文特征向量 v s 之后，我们可以通过连接相应的特征嵌入向量来获得收集的表示 v = [ v cb | | v u ] | | v ti | | v s ] 。接下来，为了进一步提取场景感知的特定信息，我们应用一个场景转换模块来处理前面的表示 v 。具体来说，对于i场景，我们计算 v' ，如下所示： v' = v ⊗ β i + γ i Bias Adapting Loss Scenario 2 Prediction Scenario 1 Prediction Debias Expert Net Scenario N Prediction .... Output Value Multi-Scenario Gate Specific Experts Debias Expert Net Bias Net Shared Experts Debias Expert Net .... Debias Expert Net Debias Expert Net Scenario-Specific Tranform Layer Debias Expert Net .... Debias Expert Net Main Net FC Layer FC Layer BN BN Scenario-N transform ... Scenario-2 transform Scenario-1 transform Feed-Forward Attention Activation Weight Cross-Scenario Behavior Extract Layer Weighted Sum Pooling Scene Specific Transform Layer Fully Connected Layer X Feed-Forward Attention Feed-Forward Attention Out Product .... Embedding Layer X Element-Wise Product .... Concatenate Bias Features User Basic Profiles (Fairness Coefficient) Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021 User Behavior Sequence Scenario Context Features Target Item Features Sum Operator

20. 多场景联合建模技术 User Behavior Sequence Scenario Context Features Target Item Features Sum Operator

21. 多场景联合建模技术 User Behavior Sequence Scenario Context Features Target Item Features Sum Operator

22. 多场景联合建模技术 Bias Adapting Loss 为了缓解干预偏差问题，我们提出了公平系数的概念来衡量每个样本的重要性，并希望所提出的模型能够从具有高公平系数的样本中获得更多信息，因为这些类型的样本较少受到干预。我们在考虑公平系数的情况下使用交叉熵损失函数，定义如下： Loss = |L k | ∑ l=1 i,k w fairness * loss k,l,j . i,k loss k,l,j 是场景k和项目i的第l个样本， w fairness 是场景k和项目i的公平系数， loss k,l,j 的计算如下： loss k,l,i = − I k,l,i log p k,l,i − (1 − I k,l,i )log(1 − p k,l,i ) 其中， p k,l,i 是SARNet的输出， I k,l,i 是场景s和项目i的第个l样本的标签， I k,l,i = 1 表示该条样本为正样本，即被点击。 Bias Adapting Loss Scenario 2 Prediction Scenario 1 Prediction Debias Expert Net Scenario N Prediction .... Output Value Multi-Scenario Gate Specific Experts Debias Expert Net Bias Net Shared Experts Debias Expert Net .... Debias Expert Net Debias Expert Net Scenario-Specific Tranform Layer Debias Expert Net .... Debias Expert Net Main Net FC Layer FC Layer BN BN Scenario-N transform ... Scenario-2 transform Scenario-1 transform Feed-Forward Attention Activation Weight Cross-Scenario Behavior Extract Layer Weighted Sum Pooling Scene Specific Transform Layer Fully Connected Layer X Feed-Forward Attention Feed-Forward Attention Out Product .... Embedding Layer X Element-Wise Product .... Concatenate Bias Features User Basic Profiles (Fairness Coefficient) Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021 User Behavior Sequence Scenario Context Features Target Item Features Sum Operator

23. 多场景联合建模技术离线实验选择飞猪双十一期间飞猪、支付宝、淘宝三端中20个主要场景做离线实验，下图为每个场景的数据分布情况，和用户的行为分布情况 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

24. 多场景联合建模技术离线实验 1、混合场景模型的总体性能比单一场景模型和多场景模型差，这证明模糊场景差异会损害多场景CTR预测的建模。此外，HPS、Cross-stitch、 MMOE、CGC和PLE都实现了更好的整体性能，证明了利用场景之间的区别和关系的重要性。 2、尽管单一场景方法的性能都优于混合场景方法，但在场景#18中，单一场景方法的AUC比混合场景方法差。我们推断这是因为场景#18的数据占训练数据集的0.15%，不足以训练一个合理的模型，而混合场景方法有足够的数据进行训练。 3、在场景#8中，以单一场景方式训练的DIN模型比HPS、Cross Stitch、 MMOE、CGC和PLE具有更好的性能，这与整体性能结果相反，它表明在某些场景中，现有的多任务模型无法提取关于场景和用户的更深层信息。 4、SAR网络在所有场景中都表现出稳定的性能。此外，与HPS、 Cross Stitch、CGC和PLE相比，SAR网络也取得了一致的改进，这表明了显式建模用户兴趣转移和提取场景特定信息的优势 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

25. 多场景联合建模技术消融实验（Cross-Scenario Behavior Extract Layer） Base表现最差，这表明有用的信号很容易被隐藏在噪声中而无需提取。此外，与基础模型相比，目标项目注意或情景注意都可以提高AUC，表明考虑目标项目或情景上下文信息的相关性都可以带来收益。考虑目标项目和场景上下文特征的第三和第四注意机制比基础模型执行得更好，但比目标关注更差，这意味着直接连接目标项目和场景上下文特征作为 key不能完全挖掘并利用有用信息。相比之下，SAR-Net分别从目标项和场景上下文的角度学习注意权重，获得了最好性能。结果表明，分别学习权重可以避免相互干扰，并且可以提取不同场景下用户的兴趣转移。 Target attention：将目标商品作为query，行为商品作为ke Scenario attention：以场景上下文特征为query，以行为发生时的场景上下文信息为ke Concatenate attention：将目标商品和场景上下文concatenate起来作为quer Hieraechical attention：使用两层网络。在第一层中，与目标项连接的场景上下文特征用作query。在第二层中，场景上下文特性用作query。将两个注意层的权重相乘，生成最终的汇聚权重 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

26. 多场景联合建模技术消融实验（Bias Net and Bias Adapting Loss）当对被干预商品进行下采样时，性能先略有改善，然后有所下降。当子采样率为0.7时，性能最好。这是因为下采样将减少数据集中干预项的比例，以便模型能够以更公平的方式学习每种类型项的信息。但是，当比例逐渐降低时，模型的性能会下降，表明过多的次抽样导致样本的减少，用户与项目之间的交互信息没有得到充分利用。与base和下采样方法相比，在每个专家网络中引入偏差网络，对专家在训练过程中的预测进行重新加权，可以获得更好的性能。此外，偏差适应损失可以使模型适应干预数据，并根据样本的重要性学习信息。我们设计的同时具有偏置网络和偏置自适应损耗的SAR网络可以进一步提高性能，证明了偏置自适应损耗和偏置网络的有效性及其互补性。 1）对人工干预而过度曝光的商品下采样。采样率分别为0.9,0.8,0.7,0.6； 2）将偏差网络引入专家网络； 3）利用偏置自适应损失； 4）使用偏置网络和偏置自适应损失。 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

27. 多场景联合建模技术消融实验（Scenario-Speci c Transform Layer）场景特定转换层通过加强不同场景的关键信息，进一步建模场景之间的差异和关系。在本节中，我们以移除场景转换层的SARNet为base，考虑以下设置：1）参考PLE，采用多层专家网络提取特征。层数分别设置为2、3、4、5；2）采用单层专家网络，在专家网络（SAR网络）前增加场景转换层。从表6可以看出，随着层数的增加，多层提取网络结构的效益逐渐收敛。与多层专家提取结构相比，场景特定变换层以较少的参数获得了更好的结果。 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

28. 多场景联合建模技术在线实验线上实验7天，base模型为MMOE，其中线上实验对长尾流量场景进行合并。实验结果如图所示。很明显，SARNet的性能稳定优于base，证明了所提模型在实际多场景CTR任务中的有效性。此外，我们还分析了模型在不同类别下的性能，并与base模型相比，我们发现：1）SARNet使各类别的曝光率更加均匀； 2） SAR网络在所有类别中都实现了稳定提升；3）流量占比较小的类别提升更明显。这些结果表明，SAR-Net有效地缓解了干预偏差问题，并实现了每个商品的公平推荐。 Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

29. 多场景联合建模技术总结在本文中，我们提出了一种新的场景感知排序网络，以解决阿里巴巴旅行营销平台中遇到的两个问题，即多场景建模问题和干预偏差问题。SAR-Net通过两个特定的注意模块学习用户的跨场景兴趣，从不同场景中获取丰富的数据。然后，采用场景特定的转换层进一步提取场景特定的特征，然后使用两组debias专家网络。此外，上述中间结果通过多场景选通模块融合到最终结果中。此外，我们还提出了公平系数的概念来衡量单个样本的重要性，并将其用于重新加权debias专家网络中的预测。在离线数据集和在线A/B测试上的实验结果表明，SAR网络在多场景预测方面有稳定的性能提升。在未来，我们打算研究引入更多用户细粒度行为的影响。 Email: qijie.sqj@alibaba-inc.com Wechat: Ezail_Ju Shen et al, SAR-Net: A Scenario-Aware Ranking Network for Personalized Fair Recommendation in Hundreds of Travel Scenarios, CIKM, 2021

30. 谢谢大家观看～