目前,店铺展示形式主要还是以商品卡片为主,包含店招区域(店铺标题、店铺背书、背景图、回头客评论等)和商品区域(可滑动查看多个商品),如下图所示。
卡片排序是本场景比较独特的一环:相比于商品和店铺,卡片是一个两级结构,排序时需要同时考虑商品和店铺。我们将卡片排序建模为级联模型:商品排序和卡片排序,商品排序用于选择卡片内的商品从而组装卡片,卡片排序用于对组装好的卡片进行排序。
卡片是一个两级结构:包含店铺和商品。一开始我们尝试对卡片整体进行建模,模型输入包括 商品、店铺、用户侧特征。模型结构如图所示,但是鉴于本场景流量较少,初期训练数据不够,从头训练一个复杂的卡片排序模型难度较大。因此我们考虑将卡片排序分解为两部分:商品排序和卡片排序。其中,商品排序预估用户对目标商品的点击率,可以借鉴其他成熟场景的商品预估模型,我们这里借鉴了首猜的商品排序模型;而卡片排序在接收到商品排序的分数后,首先根据商品分数截取 top3商品用于组装卡片,然后预估用户对卡片整体的点击率。我们称之为 ItemAwareShopRankingModel(简称为IASM),其模型结构如下图所示:
对于商品排序模型,用户的行为序列是非常重要的特征;而用户的行为序列越长,模型对用户的兴趣捕捉的更为精准,因此如何利用用户长期行为成为一个研究热点;例如阿里妈妈团队的 SIM [1]、淘宝首猜团队的 ETA[2] 都取得不错的效果。
我们借鉴了SIM 和 ETA 两种模型,实现对用户长周期兴趣建模,具体模型结构如下:
但是实践中发现,基于首猜模型直接finetune负向效果明显。分析发现首猜样本和好店商品样本差异较为明显,且本场景样本数据量较少而模型参数量较大,因此,因此在实践中只训练揽月模型的LogitsLayer和BiasNet部分,具体实验结果如下。
作为店铺导购场景,我们的核心目标是为了帮助用户找到其感兴趣的好店。因此为了增强用户对“好店”的认知,让用户进店后“逛起来”,我们尝试去优化场景的引导类指标(包括引导订阅、引导ipv和引导停留时长等)。另一方面,我们对一跳点击指标和引导指标进行相关性分析,发现点击和引导ipv以及引导停留时长等任务相关系数较高(0.895),两者联合建模可能会有正向收益,具体数据如下:
另外,考虑到引导ipv和引导停留时长任务相关度很高(0.957),因此选择只对引导ipv进行建模;最终,我们选择对点击、引导订阅以及引导ipv等任务进行多目标联合建模。
建模思路:将点击、和订阅任务建模为二分类,将引导ipv任务建模为多分类(需预先对引导ipv进行等频分桶);直接建模 从曝光到点击的概率(click)、从曝光到订阅的概率(subscribe)、从曝光到引导ipv(lead_ipv);
训练数据:
点击任务:点击样本作为正样本,曝光未点击样本为负样本;
订阅任务:点击且订阅样本为正样本,曝光未点击以及点击未订阅样本为负样本;
引导ipv任务:预先对引导ipv等频分为五个桶,再加上负类(曝光未点击),将所有曝光样本分为六类;
模型结构:采用 shared-bottom 网络结构,底层参数共享,顶层 每个任务有单独的 tower,期望能够学习到不同任务特有的 feature,模型结构参考参考图1。
除此shared-bottom网络结构之外,我们还尝试了其他的多任务模型,包括 ESMM[3] 和 MMOE[4] 等,但离线训练并未取得明显提升,因此没有上线。
我们在融合多个任务分数时,尝试了公式法和模型融合两种方法:
公式法融合:参考 ctr 和 cvr 的融合公式,我们将其推广到融合点击分、订阅分和 引导ipv分:
,其中
表示店铺从点击到订阅的概率,
表示 引导ipv分数和 ctr 的比值。经线上AB实验,最终确定一组最优参数
。
ltr 模型融合:将多个目标加权组合得到最终目标,然后使用 gbdt 回归模型去拟合最终目标:。相比于公式法,ltr模型提升明显:人均曝光卡片数+1.39%,人均点击卡片数+1.36%,引导停留时长+7.13%,全引导IPV+7.95%,全引导订阅-0.24%。
卡片重排
浏览深度在一定程度上能代表用户对于本场景的心智,浏览深度越高,表明用户对于本场景的心智越强;因此我们在后期尝试去优化整体信息流的下翻深度,期望通过卡片重排来提升用户的浏览深度。
为了优化浏览深度,我们尝试对用户下滑概率进行建模。
引用
[2] 阿里定向广告新一代主模型:基于搜索的超长用户行为建模范式
[3] Ma X, Zhao L, Huang G, et al. Entire space multi-task model: An effective approach for estimating post-click conversion rate[C]//The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018: 1137-1140.
[4] Ma J, Zhao Z, Yi X, et al. Modeling task relationships in multi-task learning with multi-gate mixture-of-experts[C]//Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining. 2018: 1930-1939.
我们是大淘宝技术的好货&好店技术团队,主要服务淘宝两大导购业务:有好货和每日好店,为上亿消费者提供导购服务,为千万商家、机构和达人提供内容运营平台和商业化方案,致力于通过技术和业务创新提升淘宝导购效率。团队研究方向主要包含商品推荐、内容推荐、AIGC等,我们在推荐算法领域也有很深的技术沉淀,在国际会议和杂志上发表数十篇学术论文。
大淘宝春季 2024 届实习生招聘已正式启动,欢迎对导购业务感兴趣的同学加入我们,可将简历发送到 houwei.hou@alibaba-inc.com
¤ 拓展阅读 ¤