猜你去哪:飞猪用户旅行意图预测
如果无法正常显示,请先停止浏览器的去广告插件。
1. 猜你去哪:⻜飞猪用用户旅行行行意图预测
熊⻜飞(子子厓)阿里里里巴巴集团
2. 提纲
• 旅行行行场景下的算法策略略现状
• ⻜飞猪用用户旅行行行意图预测
• 总结和展望
3. 提纲
• 旅行行行场景下的算法策略略现状
• ⻜飞猪用用户旅行行行意图预测
• 总结和展望
4. 场景介绍
首首⻚页
酒店
交通
• 面面向用用户提供旅行行行商品和旅行行行内容服务的综合旅行行行电商平台
• 涵盖度假商品,⻔门票,酒店,机票,火火⻋车票,内容以及POI等多源实体
• 通过算法帮助用用户找到理理想和合适的旅行行行商品和旅行行行方方案,最大大化流量量分发效率
5. 旅行行行场景的特质
• 用用户旅行行行是超低频需求,用用户行行行为数据以及商品行行行为数据异常稀疏
• 用用户访问频次低、间隔⻓长,上一一次的访问信息可能失效,需要实时快
速的捕捉当前用用户的真实兴趣
• 旅行行行具有明显的行行行前->行行行中->行行行后的状态转移过程,并且不不同
状态下存在明显的差异
• 用用户对旅行行行的决策期较⻓长,会有明显的前瞻规划需求
6. 旅行行行场景的特质
跨国
跨城
• 旅行行行具有丰富的混合LBS特质,包括跨城的⻓长途旅行行行、
跨区的周边游旅行行行以及跨⻢马路路的短途旅行行行
跨路路
跨区
• 旅行行行行行行为多元化,涵盖多个行行行为域,包括火火⻋车票,酒
店,机票,度假宝⻉贝等
• 旅行行行不不是单点需求,是一一个package需求,一一次完整的
旅行行行涵盖多个行行行为域的交叉
7. 提纲
• 旅行行行场景下的算法策略略现状
• ⻜飞猪用用户旅行行行意图预测
• 总结和展望
8. 旅行行行意图识别
度假商品
旅行行行内容
目目的地
火火⻋车票
⻔门票
机票
• 不不管是哪种形式的旅行行行产品,目目的地属性是最重要也是最全面面的信息
• 考虑旅行行行不不变的LBS特质,用用户最重要的意图为目目的地意图
酒店
9. 旅行行行意图识别
目目标描述:
• 准确预测用用户显示旅行行行意图(目目的地偏好)
问题描述:
• 问题1:用用户旅行行行是超低频需求
泰国
上海海
在考虑用用户历史行行行为时,时间足足够⻓长,行行行为域足足够多
• 问题2:用用户访问频次低、间隔⻓长
在考虑用用户历史行行行为时,足足够实时,并且考虑时间因素
• 问题3:旅行行行行行行为多元化,涵盖多个行行行为域/旅行行行不不是单点需求,是一一个package需求
在考虑用用户历史行行行为时,充分融合用用户多域的行行行为
10. 多源行行行为的聚集性
• 用用户在短时间窗口口内,在同一一目目的地下,发生生多个类目目的行行行为,表示用用户
多源行行行为聚集性。这种聚集性更更能充分的反馈用用户确定性的旅行行行需求。
11. 多源行行行为序列列处理理
• 将用用户多源的行行行为序列列,规范化id,行行行为类型,时间,然后在目目的地维度上对
⻬齐,按照时间顺序进行行行融合排列列。
12. 旅行行行意图识别
模型设计:
• 考虑上述的用用户融合序列列,将行行行为类目目、行行行为类型
等信息通过side information的方方式加入入到序列列中
• 通过Multi-CNN抽取不不同区间范围内的局部特
征(units),同时考虑local和global信息。区
间越小小,更更加关注于局部,区间越大大,更更加关
注于全局。比比如区间为1时,考虑的是point
level
13. 旅行行行意图识别
模型设计:
• 通过用用户状态作为query,加入入时间维度特征,对
抽取出来的多组units进行行行time attention pooling
• 为了了克服意图维度用用户区分度小小的问题,采用用
pairwise的方方式进行行行训练
14. 实验
不不同域行行行为融合方方式:
• independent:只考虑一一个行行行为域
• strategy 1:多个行行行为域按照时间排列列为一一条序列列
• strategy 2:多个行行行为域各自自按照时间排列列为一一条序列列
不不同序列列处理理方方式:
•
•
•
•
•
Autoint:self-attention
DIN:attention
MLP:简单reduce_sum+MLP
ATRNN:GRU+time-attention
ATMC:Multi-CNN+time-attention
15. 实验
Kernel width
• Multi-CNN+attention可视化
• time-attention可视化
Spatial-Temporal Deep Intention Destination Networks for Online Travel Planning
16. 融合用用户兴趣建模
模型设计:
•
考虑全网网实时宝⻉贝点击序列列以及场景内宝⻉贝曝光未点击序
列列,采用用transformer+time-attention的方方式进行行行pooling
transformer
•
time-attention
考虑全网网用用户行行行为序列列,包含多个行行行为域,通过Multi-
CNN+time-attention的方方式进行行行pooling
•
concat所有特征和pooling的结果,通过多层BN+MLP进行行行
打分(CTR or CVR)
17. 实验
基线 VS 基线+正负反馈序列列
基线+正负反馈序列列 VS 基线+正负反馈序列列+全网网行行行为序列列
18. 提纲
• 旅行行行场景下的算法策略略现状
• ⻜飞猪用用户旅行行行意图预测
• 总结和展望
19. 总结
指导
特征设计
模型设计
表达
20. 感谢聆听
21. 邮件:xiongfei.xf@alibaba-inc.com
微信:
欢迎加入入我们