美团到店综合业务场景下的知识图谱构建与应用实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 美团到店综合业务场景下的
知识图谱构建与应用实践
美团到店平台技术部 - 李翔
2. 目录 CONTENT
01 美团到店综合业务场景介绍 02 到店综合知识图谱的构建
03 到店综合知识图谱的应用实践 04 到店综合知识图谱的展望
3. 01
美团到店综合业务场景介绍
4. 美团到店综合业务
美团到店综合业务涵盖了本地生活中的休闲玩乐、丽人、亲子、结婚等众多行业
. . . . . .
到店综合部分行业示例
5. 到店综合业务场景下的知识图谱
深耕本地生活下的细分行业,不断提升供需匹配效率
起心动念
用
户
决
策
路
径
考虑
形成场景化诉求 考虑具体方案
“周末陪宝宝去
哪儿玩?” “考虑玩的方案
户外烧烤”
场景需求
选择评估 交易购买 履约服务
选择自己喜欢
的服务/商品 在平台交易以
换取服务/商品 商品到货
服务完成
具象需求
商户
场景需求
商品
以用户需求节点为中心,链接行业知识、商户、商品和内容...
具象需求
到店综合知识图谱 (GENE,GEneral NEeds net)
内容
6. 到店综合知识图谱的挑战
1
需求多元 用户需求多样化,如何更好的理解和表达用
户在不同行业的多元需求? 多层次多维度的图谱体系设计
行业复杂 涵盖百余个本地生活行业,行业知识专业且
差异大,如何在多行业上快速高效构建知识
图谱? 高效和可复用的挖掘流程和模型
少样本学习进一步提升人效
行业图谱贴近业务应用,对图谱节点和关系
准确性要求极高,如何保证图谱的质量? 多源多模态数据利用
多方法联合互补
2
3
质量要求高
7. 02
到店综合知识图谱的构建
8. GENE·到店综合知识图谱体系设计
9. 图谱各层构建涉及的主要任务一览
行业体系层 需求对象层
具象需求层 场景要素层 场景需求层
行业类目树构建 对象及属性挖掘 具象需求挖掘 场景要素挖掘 场景需求组装
类目属性挖掘 同义和上下位
关系构建 具象需求-属性
关系构建 场景要素-具象
需求关系构建 场景需求判别
供给关联
供给层
10. 行业体系层构建 - 类目树构建和属性挖掘
行业类目树构建
以沉淀的行业类目信息为基础,结合人工定义完善
类目属性挖掘
人工定义 + 业务策略
消费频次 淡旺季
距离偏好 价格分布
复购周期 ......
11. 行业体系层构建 - 类目节点和供给的关联
• 转化为分类问题,基于多源异构数据建模,充分利用供给信息
• 基于商户名、商品名、商品详情、商户内容(UGC)、商户画像的多源数据融合判别
浴场
0.92
Softmax
FC Layer
…
私汤
0.03
Self-Attention
BERT
Doc2vec
Embedding
Fixed Position
Embedding
多源数据
FC Layer
商户名
商品名+商品详情
商户UGC
One-Hot
Vector
商户画像
12. 需求对象层构建 - 对象及属性挖掘
粗粒度挖掘:获取对象和属性维度,确认需求对象层的结构
关键词抽取
相关词聚类
维度提炼
词频 / TF-IDF / TextRank 关键词W2V表示 对象和属性维度提炼
噪声词BERT过滤 DBSCAN密度聚类 各维度种子词归纳
13. 需求对象层构建 - 对象及属性挖掘
细粒度挖掘:无监督扩充 + 有监督标注,少样本条件下对象和属性节点的高效挖掘
同义和上下位关系构建:统计特征 + BERT
14. 具象需求层构建 - 具象需求挖掘
具象需求的候选生成:基于Pattern生成 + 基于短语挖掘生成,优势互补
基于Pattern生成 基于短语挖掘生成
[属性] + [对象] 组合 需求对象的依存句法关系挖掘
AutoPhrase远程监督挖掘
e.g. [手法]+[部位]+[对象]:泰式背部推拿
[位置]+[对象]:户外烧烤
[休闲项目]+[对象]:吃火锅K歌
...
e.g. 魔鬼滑梯、图书漂流、小猪跳水 ...
具象需求候选池
15. 具象需求层构建 - 具象需求挖掘
具象需求的质量判别:Wide&Deep结构的联合判别,充分利用统计特征和语义特征
Softmax
FC Layer
Deep Features
FC Layer
FC Layer
C T 1 T 2 … T N
E [CLS] E 1 E 2 … E N
[CLS] 吃 火 … 歌
Wide Features
TF
Wide
PPMI
吃
POS
…
火
锅
K
DEG
歌
具象需求候选池
Deep
16. 具象需求层构建 - 具象需求-属性关系构建
• 包含节点的固定Pattern提取,快速获取关系三元组
• 包含节点的语料上下文建模,进一步丰富关系三元组
Softmax
FC Layer
FC Layer
FC Layer FC Layer
Average Pooling Average Pooling
BERT
CLS
今
天
#
拔
罐
#
拔
完
&
排
毒
&
效
果
明
显
17. 具象需求层构建 - 需求节点和供给的关联
• 转化为语义匹配,构建召回-排序-聚合三段式匹配流程
• 包含商户、商品和内容三种类型的供给关联
具象需求
商户
商户名文本
同义标签扩展 少样本学习 商户名
匹配结果
pattern匹配 BERT语义匹配 内容
匹配结果
内容
内容文本
子句拆分
商品
商品名&详情
文本
召回
排序
商品
匹配结果
内容关联关系
关系规则聚合
聚合
商品关联关系
商户关联关系
18. 场景要素层构建
场景要素拆解
人物
场景要素挖掘 场景要素-具象需求关系构建
无监督扩充 + 有监督标注 Pattern提取 + 上下文建模
空间
时间
目的
......
构建流程高效复用
19. 场景需求层构建
场景需求判别
场景需求组装
以场景要素为基础,定义多种类型的模板组合
人物
空间
时间
目的
...
周末和闺蜜聚会
户外亲子
基于场景要素-具象需求-场景要素的关系传递
构建场景要素关系评分模型,过滤低质场景需求
20. 数据沉淀
60+ 40万+ 1亿+
行业覆盖 需求节点 三元组关系
100+ 95%+ 90%+
关系类型 准确率 召回率
21. 03
到店综合知识图谱的应用实践
22. 到店综合知识图谱应用概览
应用层
策略层
搜索
推荐
供给画像
信息展示
用户画像
......
推荐匹配
GENE-到店综合知识图谱
知识层
数据层
行业
体系
商户
需求
对象
具象
需求
商品
场景
要素
内容
场景
需求
用户
搜索 推荐
召回
可解释性
... 召回
排序
...
信息展示
供给聚合
标签筛选
推荐理由
...
到店新兴行
业场景下的
应用探索
23. 搜索应用
召回 + 可解释性优化
• 知识图谱 + 召回
标签召回
结构化召回
• 知识图谱 + 可解释性
24. 推荐应用
• 知识图谱 + 召回
图谱信息直接用于关联召回
• 知识图谱 + 排序
图谱信息作为特征融入排序建模
美团首页-猜你喜欢
到店综合业务涉及的多个频道页,如休闲/玩乐、结婚/摄影
25. 信息展示应用
供给聚合
标签筛选
推荐理由
26. 到店新兴行业场景下的应用探索
到店新兴行业 - 剧本杀
问题1: 平台类目缺失 问题2: 用户决策效率低 问题3: 商品上架繁琐
平台缺少专门的“剧本杀”类
目,中心化流量入口缺失 剧本杀的核心是剧本
缺乏标准的剧本库,也未建立
供给和剧本的关联关系 没有可用的标准模板用以信息
预填,商户的商品上架比例低
剧本杀供给标准化
以标准化为基础,改善供给管理和供需匹配
27. 基于剧本杀知识图谱的供给标准化
GENE中的剧本杀行业图谱
剧本杀供给挖掘
剧本杀行业图谱节点和关系示例
标准剧本库构建
剧本杀供给标准化流程
供给与标准剧本关联
28. 标准化建设 - 剧本杀供给挖掘
剧本杀商户挖掘
• 无监督匹配
剧本杀关键词文本匹配
各来源匹配分数计算
• 有监督拟合
线性回归获取各来源权重
加权计算最终分数
29. 标准化建设 - 标准剧本库构建
标准剧本名称的挖掘 - 规则聚合
• 商品名称清洗 构建词库规则过滤,序列标注字符级分类
• 名称相似聚合 基于最长公共子序列(LCS)的相似度计算
剧本杀商品名称 清洗后的商品名称
《舍离》情感本 舍离
【情感大戏】舍离壹
舍离 1 城限
名称
清洗
舍离壹
舍离1
规则聚合结果
舍离
舍离壹
LCS相似
度计算
舍离1
30. 标准化建设 - 标准剧本库构建
标准剧本名称的挖掘 - 语义聚合
• 规则聚合遇到的问题
字面距离相近但不属于同一个剧本
商品名称常出现简称缩写和错别字
• 从规则聚合到语义聚合
基于BERT的DSSM语义匹配
规则聚合结果生成粗粒度样本
主动学习 + 针对性样本构造
31. 标准化建设 - 标准剧本库构建
标准剧本名称的挖掘 - 多模态聚合
• 语义聚合遇到的问题
名称语义不同但属于同一个剧本
• 从语义聚合到多模态聚合
文本 + 图像联合匹配
基于BERT的文本编码器
基于Efficientnet的图像编码器
32. 标准化建设 - 供给与标准剧本关联
商品-标准剧本关联
内容-标准剧本关联
33. 标准化应用 - 类目构建
剧本杀
类目入口
34. 标准化应用 - 推荐
基于剧本属性关联召回 + 图谱信息融入双通道DIN建模排序
35. 标准化应用 - 信息展示
剧本评分
筛选和外露
标签筛选
标签外露
供给关联信息外露
剧本榜单
36. 04
到店综合知识图谱的展望
37. GENE展望
起心动念
用
户
决
策
路
径
形成场景化诉求
(场景需求)
考虑
考虑具体方案
(具象需求)
场景需求和具象需求的持续挖掘
实现到店综合所有行业的全覆盖
选择评估 交易购买 履约服务
选择自己喜欢
的服务/商品 在平台交易以
换取服务/商品 商品到货
服务完成
更深更广的应用
持续提升供需匹配效率
激发用户更多需求
从供给侧向用户侧延伸
覆盖用户决策的
全链路,构建用
户服务体验图谱
38. 非常感谢您的观看