个性化消息推送在阅文的实践
背景
消息推送作为一种高效触达用户的手段,被广泛应用于各大APP。常见的消息推送有:
无论是哪种类型的推送,只有进行精细化地推送,即在合适的时候给合适的人群推送合适的内容,才能在不打扰用户、给用户带来价值的同时,提升产品用户留存、活跃和召回流失的用户。
这其中有两个重点,一是保证推送尽可能展示给目标客户,提升推送的“量”;二是尽可能提高推送内容与用户的匹配度,从而在避免用户反感的条件下促进目标事件的转化,保证推送的“质”。前者是后者的前提,后者是前者价值得以发挥的保证,二者相辅相成,缺一不可。
作为深耕数字阅读领域的公司,阅文拥有海量的优质内容。基于阅文的个性化分发能力,我们希望通过消息推送将优质内容传递给用户,提升用户对产品的黏性。
二
问题分析
下面依次分析这两部分:
要想做到精细化运营,我们应该从全量发送的方式上往个性化用户分组的方式上转变,试想如果所有消息都是一股脑全量发送,无法找到消息真正合适的受众,虽然量大但是命中率极低,还易给用户造成不好的困扰,严重时可致卸载。所以应该通过用户标签选择合适的用户群,根据不同的分组用户为用户发送合适的推送消息,不仅转化率会有所提高,做的恰当的话也会为用户带来更好的用户体验。
三
如何搭建个性化消息推送中台
正所谓巧妇难为无米之炊,个性化下发需要有丰富的物料池。实践中我们也发现,物料池的数量在一定范围内,个性化分发的效果和物料池的规模成正相关。我们采用人工手写文案,模型自动化产出文案两者结合的模式来生成文案。人工手写文案的优势在于类型丰富且灵活,模型产出文案的优势在于产出效率高。模型产出文案方面,目前主要有抽取式、生成式、UGC择优式三种形式,基于网文预训练模型从0到1构建端到端生成式方案,同时对于不同场景针对不同风格进行强化产出。生成的文案类型有消息通知体、角色对话体、昵称体、题材卖点体、作者@体、主副标题、知乎体等。新文案产出后会进行人工审核,过滤掉一些不合适下发的文案。
新生成的物料,缺乏下发数据的积累,推送的效果无法保证。如果某个物料在未经充分验证的情况下,对所有的用户进行计算,有可能因为某一特征的影响导致分值特别高,而造成过大范围的下发,被展现给成百上千万用户。因此,批量生成的新文案,会先走小流量进行下发,积累新文案下发的点击、阅读等数据。通过收集小流量实验结果,可以自动筛选出优质文案,然后在主流量中下发优质文案,保证了下发文案的质量。
召回层的主要功能是对用户和物料进行粗粒度的匹配,缩小候选集范围,这样既降低了排序阶段模型预估的压力,也保证了排序阶段的效果。
作为发轫于NLP领域的经典方法,Embedding技术有着广泛的应用。通过将物料信息压缩到一个Embedding向量,不同物料向量之间的距离可以反映这些物料的相似性。更进一步来说,两个向量间的距离向量甚至能够反映它们之间的关系。应用Embedding向量的强大表示能力,推荐系统可以用它来找到相似的物料,匹配感兴趣的用户。
使用Embedding进行召回具有以下优点:
l 可以将多路召回中使用的信息,作为Embedding召回的附加信息融合进最终的Embedding向量。这样就减少了多路召回的超参数个性化、不同召回策略产生的分值不具备可比性的问题;
l 可以实现线下训练平台和线上服务平台完全解耦,可以灵活地选择任意离线机器学习工具进行模型训练;
l 线上服务没有复杂计算,推荐系统线上延迟极低。
相较于电商、在线视频等应用,在线阅读场景中,用户的行为数据比较稀疏。因此,我们通过将用户历史行为(阅读、购买、推荐票、加书架等)聚合构建评分表,然后构建书序列。假设相似的书在不同书序列中有相似的上下文,然后通过某本书上下文的书来预测该书的概率,得到书的向量表示。
离线评估结果如下:
应用的效果
总结和展望
1. 目前已完成构建了个性化消息推送中台化服务能力,并在业务中得到了应用,取得了一定的线上效果。
2. 不同用户对消息推送的接受程度不一样,有些用户比较愿意接收消息推送,有些用户则比较反感消息推送的打扰。同时厂商侧对于APP的消息推送下发也有一个总量的限制。因此,下一步我们要考虑优化用户的下发次数,根据用户特点进行差异化。同时也要根据用户活跃时间的差异,个性化消息推送时间。
3. 不仅要考虑短期指标(文案点击、阅读等),还要优化消息推送对用户长期活跃的影响,例如留存,通知关闭率等。
4. 最后,感谢业务方、消息平台、智能业务中心小伙伴的大力支持!
1. Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar Chandra, Hrishi Aradhye, Glen Anderson, Greg Corrado, Wei Chai, Mustafa Ispir, and others. 2016. Wide & deep learning for recommender systems. In Recsys. 7–10.
2. Paul Covington, Jay Adams, and Emre Sargin. 2016. Deep neural networks for youtube recommendations. In Recsys. 191–198.
3. Sculley, D.; Holt, G.; Golovin, D.; Davydov, E.; Phillips, T.; Ebner, D.; Chaudhary, V.; Young, M.; and Crespo, J.-F. 2015. Hidden technical debt in machine learning systems. In Neural Information Processing Systems (NIPS).
作者介绍
一白
目前就职于阅文集团智能业务中心,算法策略研发工程师
Jeff
目前就职于阅文集团智能业务中心,是用户画像负责人