NLP技术辅助⼈⼯客服⾼效服务的探索和实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. NLP技术辅助人人工工客服
高高效服务的探索和实践
T
智能客服中心心-潘路路
2022年年5月月
美团平台/语音交互部
报告内容包含跨团队共同成果,在此感谢陈瑞年年、胡文文星、刘操、赵子子健、张冠炜等同事的重要贡献。
2. 个人介绍
负责人工客服提效智能工具研发的算法专家
T
具体包括服务流程引导、服务知识推荐、话术引导、
服务工单自动记录、知识挖掘等
曾在阿里巴巴集团负责淘宝商品搜索排序优化
阿里小蜜知识问答等技术方向
2
3. 目录
01 客服辅助的业务背景
03 未来探索
T
- 实时辅助引导技术
- 服务过程自动记录
02 核心技术工作
3
4. 人工客服的简介
客服人员所需要的技能?
售中
售后
业务知识
服务流程
景点/酒店设施咨询
酒店有停车位吗
…
入退房政策咨询
第二天几点退房
T
售前
什么是客服(人工坐席)?
添加备注请求
刚才我点的餐不放辣
…
开发票咨询
帮忙开个发票
无人接单咨询
怎么还没有骑手接单
…
到店无法入住咨询
我到这酒店说房满了
沟通技巧
5. 美团客服的业务特性
业务规模大
年度交易用户
流程复杂
6.9亿
急迫度高
用户心情急迫
880万
商品需求紧急
T
活跃商户
520万+
服务领域多
帮大家吃得更好,生活更好。
外卖骑手
1w+
细分业务场景
业务具有即时性
舆情风险高
5
6. 用户的服务旅程
问题表述,反馈信息
诉求表达
等待实施
评价反馈
沟通方案
情绪 激动
(有效安抚)
(及时解决)
沟通 潜在「方案」
(骑手商家出餐能否加
急?)
(未取餐转单?)
协商「方案」与寻求共识
(催出餐、转单、加急、接单
补贴、红包、退赔…)
服务记录
(用户问题、诉求、核实过
程、方案情况…)
问题
路由
T
将「用户表述」转化为「服务场景」
(用户表述:事件、问题、沟通情况、诉求、等待超时…)
(服务场景:商家未出餐、配送慢、骑手取错、餐品丢失…)
出现问题
寻找服务
人工客服的工作旅程
场景判断
核实身份
/订单信
息
了解诉求
查找最优方案
外呼沟通与
协商
与用户共识方案
执行
方案
服务过程记录
人工客服的工作旅程
6
7. 客服(坐席)助手的技术架构
服务过程加速
流程导航
文本处理技术
信息抽取 话术聚类
文本分类 阅读理解
序列标注
基础能力
理解 & 摘要
T
槽位提取
核心技术
意图识别
语音技术
文本生成
话术推荐
智能外呼机器人
FAQ/场景推荐
产品能力
服务过程替代
场景识别 意图识别
识别诉求 文本生成
流程切片 方案摘要
机器学习与模型训练
服务智能记录
对话内容计算
对话处理技术
引导 & 预测
流程引导
话术推荐
…
场景预测
方案预测
数据标注
挖掘
静音检测
打断检测
问答挖掘 全双工交互
优质话术 语义理解
流程挖掘 话术生成
人机环路
7
8. 目录
01 客服辅助的业务背景
03 未来探索
T
- 实时辅助引导技术
- 服务过程自动记录
02 核心技术工作
8
9. 服务过程记录
客服与用户沟通后,需要记录服务过程以及结果
服务过程自动记录
帮助质检合规判断
下一个客服快速了解状况
核心技术-服务过程自动记录
通过理解对话内容,帮助坐席自动生成需要记录的内容,
T
包括进线背景、用户诉求、解决方案等
提升服务效率
降低客服费力度
核心指标
技术指标 Rouge
业务指标 采纳率
Bleu
Precision
Recall
AHT(Average Holding Time)
9
10. 核心技术-服务过程自动记录-行业做法
文本摘要
是一个信息压缩过程,将输入的一篇或多篇文档自动压缩为一篇简短的摘要,不可避免有信息损失,但是
抽取式摘要
• Seq2Seq模型
生成式摘要
Pointer-generator模型(ACL 2017)
未登录词问题—Copy机制、生成重复问题—Coverage机制
T
• 传统方法:Lead-3、TextRank、聚类
• 基于神经网络的方法:转化为“序列标注”问题
• 缺陷:内容选择错误、连贯性差、灵活性差
SummaRuNNer模型 (AAAI 2017)
要求保留尽可能多的重要信息。方法上分为抽取式和生成式两类。
10
11. 核心技术-服务过程自动记录-行业做法
对话摘要
属于文本摘要的一种形式,面向的是对话类数据。例如
会议、闲聊、邮件、辩论、客服等等形式。通过捕捉对
生成式:Scaffold Pointer Network(2019)
话中的关键信息,帮助快速理解对话核心内容。
相比“文本摘要”引入的问题
• 话题经常转换
• 多领域
• 信息密度低
T
• 说话角色有多个,经常转换
编码说话者角色
实体信息Mask
引入领域分类损失
11
12. 特点
核心技术-服务过程自动记录-美团客服场景
通常包含固定要素
背景
填写特点 大多数从原始
通话提取
填写标准不一
骑手表示他是在
收餐处点击送达
想申诉餐损
要素
餐损已出
申诉理由
T
状态
摘要 骑手未经用户同意点
击送达,用户申请退
款,导致扣款
不同要素填写特点不同
可枚举
从原始通话中
提取
查看系统发现骑手点击
送达后用户申请退款, 告知骑手自身原因
且骑手承认自己没有打 无法申诉,建议下
电话跟用户确认就点击 次不要提前点送达
了送达
骑手不认可,
要求换客服
诉求 核实过程 解决方案 附加信息
可枚举 核实动作可枚
举,核实结果
从通话提取 从原始通话中
归纳
部分业务同
“核实过程”
合并填写 从通话中提取
标注成本高
信息密度低
12
13. 技术架构
解决思路
不同要素对应不同建
模方式
T
借助人工摘要生产伪
标签
加入关键信息抽取环
节
抽取
诉求
算法辅助挖掘、建立
类别空间
信息密度低
建模
分类
填写标准不一
标注成本高
核心技术-服务过程自动记录-美团客服场景
背景
解决方案
关键信息抽取
类别体系建设
优质摘要
筛选
生成
要素内容
挖掘
样本构建
聚类
伪标签生产
13
14. 核心技术-服务过程自动记录-美团客服场景
分类方法建模
多任务分类(加入角色信息)
多任务分类(融合多种特征信息)
平均识别准确率
8*.8%
T
单任务分类
多任务共享权重+添加角色信息
+11.6pp
增加特征信息(场景、订单状态等)
+1.1pp
角色编码方式:[unused]指代、角色名称拼接、段落编码表征
实验表明角色名称拼接+段落编码表征效果最好
14
15. 类别体系建设
诉求、核实过程等要素,通常可以定义出明确的类别标签
挖掘流程
人工摘要要素片段
聚类、频次统计(K类簇)
客服人工摘要
核心技术-服务过程自动记录-美团客服场景
• 背景:用户进线反馈餐品配送太慢;诉求:退款;解决方
案:已操作退款,外呼跟进用户退款成功…
• 背景:用户反馈餐品里有异物;诉求:退款并赔付;解决方
外卖骑手(10)
优选用户(9)
退款 申诉补贴 赔付 申诉配送费 补送 取消订单 补货
换货 报备 赔付
外卖用户(20+)
剩余要素表述
相似度计算、合并/新增
T
案:已操作退款并补偿红包*元…
聚类簇心
退款
人工筛选、审核、组合标签拆分
咨询处理
类别标签1
类别标签2
类别标签3
15
16. 核心技术-服务过程自动记录-美团客服场景
抽取方法建模
背景要素难以定义类别,但通常会在原文
出现 历史通话内容
我外卖还没送到,联系不上骑手 坐席填写背景
计算RougeL-
recall,保留TopN
规则后处理
(阈值、关键词)
关键句
样本
选取优质内容
就那个肯德基啊,点的全家桶
好的,这边为您联系骑手,您稍等
T
快点啊,都点了好久了,一直也
打不通电话
截取前半段
你好,很抱歉,请问是哪个订单呢
自动化样本构建
长文本友好
线上预测高效
背景:用户进线反馈外卖还没送到,联系不
上骑手…
16
17. 核心技术服务过程自动记录-美团客服场景
抽取方法演进-Span抽取
将抽取转化为阅读理解任务
句粒度抽取结果粒度过粗,包含无关信息
预测对话中每一个Token出现在答案的概率
你好,我外卖还没送到
根据上一阶段的概率挑选密度最高的Span作为答案
你好,很抱歉,请问是哪个订单呢
就那个肯德基啊,点的全家桶,
一直也打不通骑手电话
T
好的,这边为您联系骑手,您稍等
背景:用户进线反馈外卖没送到,打不通骑
手电话…
SIGIR21: Distant Supervision based Machine Reading Comprehension Model for Extractive Summarization
17
18. 生成方法建模
核心技术-服务过程自动记录-美团客服场景
词表概率
方案(处理结果)要素通常是原文相关表述的
转写,另外会包含原文之外需要推理的信息
? #
BIO 编码
O
O
? *
? +
? "
? $
? %
O
O
O
O
O
字向量
就那个肯德基啊,点的全家桶
? &
? #
? )
? *
? +
CLS
客
服
:
T
处理结果:查询运单状态正常配送中,已操作
加急,用户认可。
户 退 款 SE
P
? #) ? #* ? #+ ? #" ? #$ ? #% ? #&
O O O O O B I
? ## ? #) ? #* ? #+ ? #" ? #$ ? #% ? #&
款 SEP 告 知 用 户 退 款
? ##
O
O
B
I
? "
? $
? %
? &
? '
? #(
Bert
我
这
边
对话信息
好,快点啊,都点了好久了
输入
? #(
用
copy copy
编码层
你好,这边看到骑手已取到餐,正
在配送中,我这边帮您做一个加
急,您看可以吗
? '
知
Linear+softmax
Copy标签分类
你好,很抱歉,请问是哪个订单呢
? )
告
Linear+softmax
MLM分类
我外卖还没送到,帮忙看看
输出
Rouge-L
原始生成 0.34
生成+span_copy[1] 0.39
帮
您
退
摘要
• 安抚解释,核实身份未通过,建议用户核实
通过后再次来电
• 安抚告知商家已经接单,短信跟进收餐
• 联系商家不同意退款,告知用户
[1] https://kexue.fm/archives/8046
18
19. 抽取+生成级联建模
通话文本过长,信息密度低,影响模型性能
那个菜里面有头发
很抱歉给您造成不好的体验
怎么办吧
另外您可以打开订单提交放心吃理
赔
T
出现这种情况我们会直接投诉商家
来介入处理
一到两个工作日到账的
生成模型
Span抽取模型
核心技术-服务过程自动记录-美团客服场景
好,那我去看一下
处理结果:告知用户放心吃理赔,记录反馈
投诉商家,用户认可。
生成 VS 抽取 + 生成
分类 VS 抽取 + 分类
Rouge-L 采纳率 准确率 召回率 采纳率
+23.1pp +15.2pp +6pp +4pp +22.4pp
19
20. 客服场景服务过程自动记录属于对话摘要问题
业务多
类别体系半自
动挖掘
多任务
融合多种特征
标注难
背景
T
诉求、核实过程
抽取
样本标签自动构建
Span粒度抽取
分类
通话长
不同要素填写
特点不一
核心技术-服务过程自动记录-小结
抽取
行业经验
美团实践
一个模型搞不定所有问题,需要多模型融合
分类也可以解决问题,需要有好的类别定义
生成
方案
+
抽取粒度需要细化到片段
生成
长文本处理:先抽关键信息,再分类/生成
客服平均处理时长
下降12%
20
21. 目录
01 客服辅助的业务背景
03 未来探索
T
- 实时辅助引导技术
- 服务过程自动记录
02 核心技术工作
21
22. 话术推荐
通过理解当前输入及历史对话,预测接下来可能的回复话术
核心技术-实时辅助引导
流程引导
不同于话术提示,流程引导通过对当前通话内容和状态的判断,提
示客服接下来可以采取的动作(包括话术)
降低客服流程记忆费力度
提升服务效率和准确性
T
对于客服不知道怎么表
述,提供话术参考
对于经常性重复的话术,
提供快捷回复
22
23. Response Selection
核心技术-实时辅助引导-行业做法
基于序列 ASAPP (2019)
把对话回复问题抽象为检索问题,通过对Query理解,从预定义的话
术库中召回并进行相似度排序,找到最佳回复
在线
话术编码
上文语义编码
匹配
关键词匹
配/bm25
基于层次 SMN (Microsoft 2017)
获取系统
信号特征
T
粗召
抽取上文
关键词
精排
话术库建设
离线
统计高频
聚类高频
过滤去重
23
24. 核心技术-实时辅助引导-行业做法
Task-oriented Dialogue System
Natural Language Understanding (NLU)
传统意义上的流程引导可以视为客服视角的任务型对
话系统,区别在于流程引导会一次性展示多步结果
NLU
DST
Base
Response
NLG
T
Utterance
Knowledge
DPL
意图识别
槽位填充
序列标注问题
分类问题
Modular Based Dialogue System
DM
领域分类
Dialogue State Tracking (DST)
推断对话状态和用户目标。对话状态指每个槽位的取值分布情况。
NLU尝试标记用户消息,而DST从用户消息中寻找值来填充预先存在的表单
Dialogue Policy Learning (DPL)
根据当前时刻对话状态,推断可以采
取的动作
监督学习
强化学习
Natural Language
Generation(NLG)
将对话动作转换为自然语言
基于深度网络的Seq2Seq模型
24
25. 话术推荐可以从多个方向展开,不要求唯一准确
性
你们这个服务太差了,我要退款
1. 您好,很抱歉,请问要退哪个订单呢
2. 很抱歉,方便问一下是哪方面服务…
•
3. 您好,很抱歉给您带来了不好的体验
•
挑战
话术/动作可以以Pattern的形式提供给坐席,故
•
T
不需要准确填充其中的槽位槽值
•
特点
核心技术-实时辅助引导-美团客服场景
请问您说的是[time]下的[shop]家的订单吗
• 话术多样性,带来模型学习的复杂性
• 业务多,不同业务执行流程差异大
• 场景复杂,难以整理出完整的执行流程图,
供对话机器人使用
•
标注数据量巨大
•
场景总量1w+,每个场景Session数量
1k~5k不等
话术和动作类别可以形成映射关系
• 您好,订单显示您已经收到餐了
查询订单状态
25
26. 解决思路
技术框架
流程引导
基于检索的话术推荐
话术模板化
精排
话术多样
业务多
基于话术动作关
联性
意图理解 话术&动作两
阶段预测
状态跟踪
召回
文本召回
T
充分利用对话历史,
数据驱动
基于taskflow
相关性排序
规则排序
建立粗粒度话术类别
场景流程复杂
核心技术-实时辅助引导-美团客服场景
向量召回
策略选择
话术动作联
合学习
离线数据处理
话术库构建
流程挖掘
动作类型梳理
样本构建
数据源
标注困难
利用匹配模型生产伪
标签
对话日志
流程知识库
业务信息
26
27. 基于检索的话术推荐
核心技术-实时辅助引导-美团客服场景
类比传统检索系统
对话上下文
在线
对话上文
客服回复
前处理
Doc
召回
T
ASR纠错、断句处
理、Pattern化
Query
离线
对话日志
对话历史
+
回复
候选话术
排序
推荐话
术列表
对话表征
对话历史索引
27
28. 核心技术-实时辅助引导-基于检索的话术推荐
召回
文本召回
• 信息过于杂乱,不利于下游检索
• 丢失对话顺序信息,回复通常与最近几句话相关
T
短期上文:保留完整文本、保留角色信息
长期上文:抽取核心历史信息
机器人对话上文:增加对话初期背景信息
BoW
Embedding
建立索引-所有上文直接拼接?
- Average pooling
向量召回
MLM-Bert
Embedding
ToD-Bert
Embedding
- Task-Oriented
Dialogue Bert
- Bert MLM - MLM
- Average pooling - RCL
- TF-IDF weighted
average pooling
Bleu Rouge-2 Rouge-L
文本召回 0.1262 0.1948 0.3059
BoW 0.1432 0.2260 0.3501
MLM-Bert 0.1496 0.2324 0.3548
ToD-Bert 0.1891 0.2767 0.3987
28
29. 核心技术-实时辅助引导-基于检索的话术推荐
排序
Loss选择及样本构建
Pointwise
• 排序问题转化为二分类问题->交叉熵损失
Linear + Sigmoid
(U,V,|U-V|)
V
Bert + Pooling Bert +Pooling
对话上文 候选回复
U
• 正样本:客服说的下一句话
• 负样本:全局随机采样、技能组随机采样、召回列表
随机采样
Sent Level-NSP
相关性
Sent Level-RG
流畅性
Token Level-MLM
可读性
T
用对话数据继续训练Bert
R@1 R@3 B@1 B@3
NaN 0.1918 0.3412 0.1105 0.1995
MLM
NSP 0.1955 0.3469 0.1132 0.2024
0.1966
0.1985 0.3454
0.3441 0.1138
0.1125 0.2009
0.1994
RG
Pairwise
• 对<context,answer+,answer->三元组进行分类,预
测更加相关的answer
• 正样本:客服说的下一句话
• 负样本:全局随机采样、技能组随机采样、召回列表
随机采样
实验表明,使用pairwise+召回列表负样本采样效果最好,比
pointwise baseline在R@1上高出2.4pp
29
30. 核心技术工作-实时辅助引导-基于话术动作关联性的流程引导
基于话术动作关联性的流程引导
• 客服的话术和动作有显性或隐性的关联
• 话术模板和动作类型的空间都是收敛的,并可通过挖掘梳理
• 通过历史通话预测话术模板和动作类别,进而完成引导
基于Taskflow的流程引导
• 复杂场景定义流程图成本过高甚至难以完成
• 牵涉模块多,易发生错误传递
• 鲁棒性和灵活性都较差
建立话术模板 建立话术到动
作的映射 训练数据构建
话术类型挖掘 动作类型定义 话术识别模型
话术模板抽象 话术动作映射 训练数据生成
T
离线
在线
推荐动作
对话片段
对话预测模型
推荐话术
31. 动作+话术类别体系建设
话术知识库冷启动建设流程
T
定义动作统一大类和细分小类 + 挖掘不同场景下话术模板
核心技术工作-实时辅助引导-基于话术动作关联性的流程引导
话术到动作的关联映射示例:
• 您是什么原因要投诉骑手呢 à 询问问题-询问投诉原因
• 您实际是几点钟收到餐品的呢 à 询问问题-询问实际收餐时间
• 是这个来电手机号码下的订单吗 à 确认订单-确认手机号
31
32. 核心技术工作-实时辅助引导-基于话术动作关联性的流程引导
话术&动作预测模型构建
历史通话
<context1, 话术1, action1>
话术识别模型
<context2, 话术2, action2>
话术动作映射
…
训练数据生成
话术知识库
话术1: [E1, E2, E3 …]
话术2: [E7, E8, E9 …]
话术3: […]
话术识别模型
正:<E1, E2, 1>, <E1, E3, 1>, …
训练数据生成
v
Bert Encoder Bert Encoder
<SEP>
E1
对话上文
对话表征
<CLS>
拓展话术1
E2
动作分类
器
动作分类
器
<SEP>
对话上文
对话表征
Rec F1 Acc
90.67% 57.38% 70.28% 58.57%
话术排序
模型
推荐话术
推荐动作
推荐动作
推荐话术
动作分布
Attention
拓展话术2
Pre
话术动作
映射表
策略3: 话术动作联合预测
T
u
对话表征
话术推荐
模型
策略2: 先分类动作后排序话术
负:<E1, E7, 0>, <E1, E3, 0>, …
cosine-sim(u, v)
<CLS>
策略1: 先生成话术后检索动作
对话上文
话术知识库
伪标签构建
话术生成器
Attention
推荐动作
推荐话术
33. 核心技术-实时辅助引导-小结
美团客服场景辅助引导分为话术推荐和流程引导两种能力
业务多
流程复杂
基于话术动作关联性的流程引导
T
SentBert
Pairwise-Loss
类别体系建设
话术库建设
动作类别
映射关系
文本召回
向量召回
排序
基于检索的话术推荐
召回
标注困难
话术多样
伪标签构建
基于匹配的话术
识别
预测模型
话术 动作
行业经验
美团实践
经过对话任务预训练后的向量表征
比原始Bert更有效
多样的话术可以通过类别挖掘收敛
到有限的模板上
复杂繁多的流程可以通过话术动作
的关联性进行预测
客服平均处理时长
下降3%
33
34. 目录
01 客服辅助的业务背景
03 未来探索
T
- 实时辅助引导技术
- 服务过程自动记录
02 核心技术工作
34
35. 未来探索
打造抽取+生成端到端模型
知识融合
客服辅助引导
Online learning
根据坐席采纳情况实时反馈,引导模型
实时进化
基于强化学习的引导
Reward:更高的采纳、更快的进入下一
个环节
T
利用强化学习思路,通过摘要ground
truth反馈激励抽取出更有效的片段
服务过程记录
融合业务知识和系统信号,在生成网络
中,将服务对话中不全的信息,结合知识
进行补全
共情能力
更及时的情绪检测和安抚话术提示
36. T
THANKS & QA
36
37. T
更多技术干货
欢迎关注“美团技术团队”
招聘:NLP算法工程师
邮箱:panlu03@meituan.com