用人工智能技术打造虚拟生命
如果无法正常显示,请先停止浏览器的去广告插件。
1. 用人工智能技术打造虚拟生命
邵浩
Gowild狗尾草智能科技
1
2. 目录
· 聊天机器人困境及破局
· 虚拟生命核心技术及落地
· 工程实践中的其他问题
· 结束语
2 CREATE AI VIRTUAL LIFE FOR EVERYONE
2
3. 人工智能技术好牛
3
4. 聊天机器人好傻
4
5. Gartner技术曲线
知识图谱
通用人工智能
CREATE AI VIRTUAL LIFE FOR EVERYONE
5
6. NLP为什么这么难?
1893
CREATE AI VIRTUAL LIFE FOR EVERYONE
6
7. 人是怎么对话的?
上下文
静态世界观
静态世界观
今天天气不错
关系
动态情绪
动态情绪
所处环境
CREATE AI VIRTUAL LIFE FOR EVERYONE
7
8. 时代vs入口
IT
时代
互联网
时代
移动互联网
时代
AI
时代
8
9. 聊天机器人体系
框架
客观话题
闲聊
聊
天
机
器
人
情感表达
被动交互
任务对话
事实型
产品
问答
主动交互
非事实型
平台
CREATE AI VIRTUAL LIFE FOR EVERYONE
9
10. 三要素
AI三要素 算法
Chatbot三要素 人工
算力
数据
数据
算法
CREATE AI VIRTUAL LIFE FOR EVERYONE
10
11. 人工智能的人格化和IP化
11
12. 多模态交互
CREATE AI VIRTUAL LIFE FOR EVERYONE
12
13. 虚拟生命
用人工智能技术模拟生命的主要特征,
以多形态和多模态进行交互,
具备强大的感知和认知能力,
并进一步实现自我认知和自我进化
13
14. 人工生命:人造生命VS虚拟生命
生物
技术
初音未来
美国生物学家克雷格·文特尔制造生命的过程
来源:John Lawson
14
15. 虚拟生命能力范畴
人脸
识别
情绪
识别
看
场景
识别
声纹
识别
听
联想
记忆
思考
自动
作词
自动
谱曲
说
语音
合成
声纹
迁移
推理
共情
推荐
表情
语音
识别
动作
自动
舞蹈
姿态
CREATE AI VIRTUAL LIFE FOR EVERYONE
15
16. 虚拟生命技术范畴
基于
图像 人脸识别 场景识别 动作识别 声学 语音识别 语音合成 声纹识别 歌声合成
认知交互 记忆 推理 联想 对话
姿态 动作 舞蹈 日常生活 表现 人物建模 人脸建模 表情生成 歌曲 作词 自动谱曲 演唱
认知
的多
模态
交互
具有
生命
感的
表达
16
17. 语音技术:耳朵和嘴巴
语音识别
CREATE AI VIRTUAL LIFE FOR EVERYONE
语音合成
17
18. 个性化语音合成
前
处
理
后
处
理
Encoder
CREATE AI VIRTUAL LIFE FOR EVERYONE
Decoder
Vocoder
18
19. 后处理优化
19
20. 图像技术:眼睛和身体
计算机视觉
3D重建
CREATE AI VIRTUAL LIFE FOR EVERYONE
20
21. 人脸+情绪识别
高兴
喜欢
失落
愤怒
年龄: 幼年 胡须: 无 脸型: 圆型
性别: 女 眼镜: 无 头发: 黑色直发
人种: 欧美人 耳环: 无 帽子: 无
项链: 无 领结/领带: 无
悲伤
厌恶
21
22. 人脸重建
光流
估计
输
入
照
片
人脸
对齐
人脸
模型
关键
点
模型纹
理匹配
Shader
渲染
CREATE AI VIRTUAL LIFE FOR EVERYONE
降低
面片
输
出
3
D
模
型
人脸
纹理
22
23. 人脸快速重建
23
24. NLP技术:基本交互
输入
自然语言理解
自然语言生成
输出
对话管理
Web
社区问答
搜索引擎
百科站点
知识库
24
25. 问答
正则模板库
字典库
(.*)的股票代码是多少
(.*) 怎么开通
怎样购买(.*)
……
Query: 请问科大讯飞的股票代码是多少
reg = ‘(.*)股票代码是多少’
m = re.findall(reg,query)
Location.txt
Index.txt
Firm.txt
People.txt
Broker.txt
Concept.txt
请问科大讯飞
科大讯飞
Trie Match
{
}
“Firm”:“科大讯飞”
① 命中股票代码查询意图模板库中一条规则
② 抽取文本中“科大讯飞”属于公司字典
③ 因此回答股票代码查询结果:“科大讯飞的股票代码是002230”
CREATE AI VIRTUAL LIFE FOR EVERYONE
25
26. 对话
自然语言理解
意图识别
对话管理
槽位填充
DST
自然语言生成
槽位填充
DPO
加载上下文=无
给我推荐十
块钱以内的
人工智能概
念股票,要
最近涨幅靠
前的几个
查个股
查市场
查基金
查资讯
时 概 价 排
间 念 格 名
最 人 十 靠
近 工 块 前
智 钱
能 以
内
CREATE AI VIRTUAL LIFE FOR EVERYONE
起
始
时
间 结 概 最 最 最
束 念 低 高 低
时
价 价 排
间
格 格 名 最
高
排
名
4
月
8
日 4
月
1
2
日 1
人 0.1 10 10
工
智
能
推荐结果
好的,为您推荐4月8日到
12日,每股十元内的人工
智能概念股票,涨幅前十
位分别是:xxxxxx
26
27. 闲聊
你穿的衣服好漂亮
Questions
Retrieval
你的衣服真漂亮 谢谢你的赞美
我买了漂亮的衣服 哇哦,我也想要
Retrieved
QA Pairs
Matching
Matched
Answers
Ranking
Ranked
Answers
Best
Response
谢谢你的赞美
online
offline
QA Pairs
你的衣服真漂亮 谢谢你的赞美
我想为你摘星星 你咋不上天呢
无聊死了 那我陪你聊天吧
你有男朋友么 没有啊
我买了漂亮的衣服 哇哦,我也想要
你喜欢什么水果 我最喜欢吃葡萄了
你叫什么名字呢 你可以叫我琥珀
Learning
to match
Learning
to rank
[Ji, et al. 2014]
27
28. Matching算法
Strong interaction models,或基于交互
Weak interaction models,或基于表达
ARC I
[Hu, et al. 2014]
CREATE AI VIRTUAL LIFE FOR EVERYONE
MatchPyramid
[Pang, et al. 2016]
28
29. 工程方案汇总
Jieba分词
哈工大LTP
FastText
NLG
NLU
DM
配置
意图解析
任务对话
功能
问答
闲聊
基于检索
规则
CREATE AI VIRTUAL LIFE FOR EVERYONE
技能包 DB QA库
用现成的 模板 CSV
29
30. 知识图谱:跨越感知和认知的桥梁
CREATE AI VIRTUAL LIFE FOR EVERYONE
30
31. 推理
CREATE AI VIRTUAL LIFE FOR EVERYONE
31
32. DIKW体系
CREATE AI VIRTUAL LIFE FOR EVERYONE
32
33. CREATE AI VIRTUAL LIFE FOR EVERYONE
知识应用 问答 推理 联想 推荐 数据增强
知识映射 知识检索 实体发现 本体对齐 实体消歧 机器阅读
百科 Schema 常识
七律
知识加工
知识来源
知识表示
知识融合
结构化
关系抽取
事件抽取
半结构化
实体分类
非结构化
属性分类
33
34. 流程
结构化
属性
分类
知识映射
Schema
实体
分类
知识
补全
知识
扩展
问答
对话
半结构化
Parser
百科
实体发现
非结构化
关系抽取
事件抽取
CREATE AI VIRTUAL LIFE FOR EVERYONE
数据增强
知识
表示
知识
融合
常识
知识
检索
实体
链接
推理
联想
推荐
34
35. KG Schema
事物
人物
科学家
艺术人物
CREATE AI VIRTUAL LIFE FOR EVERYONE
地点
诗人
··· ···
艺术
油画 戏剧
歌剧 京剧
··· ···
雕塑
舞剧
35
36. KG Schema
5800+
实体类别定义
2000+
实体属性定义
32000+
属性同义词
CREATE AI VIRTUAL LIFE FOR EVERYONE
36
37. 实体属性上下位
配偶
夫妻
丈夫
老公
CREATE AI VIRTUAL LIFE FOR EVERYONE
妻子
夫君
老婆
内人
37
38. 数据来源
互动百科
baike.com
38
39. 知识表示
伊万卡
美国
女儿
国籍
特朗普
职业
政治家
RDF
川普
职业
商人
妻子
梅拉
尼娅
标签
人物
<特朗普, 妻子, 梅拉尼娅>
<特朗普, 女儿, 伊万卡>
<特朗普, 别名, 川普>
<特朗普, 国籍, 美国>
<特朗普, 职业, 政治家>
<特朗普, 职业, 商人>
<特朗普, 标签, 人物>
。
。
39
40. 知识补全
丈夫
朱丽倩
刘德华
妻子
丈夫
杜宪
妻子
陈道明
杜宪
陈道明
妻子
丁敏秋
丈夫
沈立
丈夫
郭芙蓉
妻子
吕轻侯
费丽达
程远
妻子
费丽达
丈夫
程远
丈夫
欧阳亭
方灵姬
妻子
40
41. 知识扩展
实体层面
实体
知识图谱
章泽天
历任董事
(实体层⾯面关系)
嫩绿茶叶
实体链接
表述
表述层面
CREATE AI VIRTUAL LIFE FOR EVERYONE
奶茶妹妹
历任董事
(表述层⾯面关系)
嫩绿茶
4月3日,“奶茶妹妹” 卸任刘强东旗下“嫩绿茶”董事
41
42. 新知识发现
互联网创业公司
主营业务为P2V(PPT to VC)
的企业。
CREATE AI VIRTUAL LIFE FOR EVERYONE
不满式创业
又称为马斯克式创业,即
因为对现状不满而创业,
对什么不满,就创建一个
公司改变它。
TMD
中国互联网新一代冉冉升起
的三个新巨头的合称今日头
条(T-头条),美团(M-
美团),滴滴(D-滴滴)。
42
43. 知识更新
微博
热搜
360
趋势
百度
风云榜
增量
更新
知识源
全量
更新
知识图谱
100万+
日均更新实体
43
44. 问答
狗尾草CEO的国籍是?
实体
关系
实体发现 狗尾草 CEO 国籍 ? 分词 词性标注
资源映射 E:狗尾草 R:国籍 R:首席执行官 ?x 关系抽取 实体链接
<?y, R:国籍, ?x> 句法分析 语义组合
语义组合
查询生成
回复生成
<E:狗尾草, R:首席执行官, ?y>
NER
SELECT DISTINCT ?x
WHERE {
?y 国籍 ?x.
res: 狗尾草 首席执行官 ?y.
}
中国
44
45. 理解用户:事件&关系抽取
突然发现明天是我生日啊
男
恭喜,提前祝你生日快乐哦~
哎没人陪我过啊,想要个女朋友
摸头,琥珀会一直陪着你哦,送
你大蛋糕
蛋糕就算啦,我讨厌甜食
是吗,琥珀可喜欢了,那下次你
收到女孩子的巧克力就给我吃吧
01-19
性别
生日
情感
状态
单身
用户
甜食
讨厌
才艺
吉他
哈哈琥珀你真逗,我来弹个吉他
给你听吧,也好久没练了
。。。
45
46. 推理机
儿子
姓名:阿木
性别:男
姓名:文华
性别:女
母亲
女儿
CREATE AI VIRTUAL LIFE FOR EVERYONE
奶奶
姓名:丽丽
性别:女
46
47. 规则推理QA
比较
上海和江苏哪个面积大?
上下位
聚合
全职高手的主演中哪个是歌手?
苏大强的大儿子是谁?
多跳
CREATE AI VIRTUAL LIFE FOR EVERYONE
射雕英雄传相关人物所处的时代是什么?
47
48. 联想:歌曲推荐
丝路
稻香
歌手
喜欢歌曲
喜欢歌曲
用户
喜欢歌曲
屋顶
喜欢歌曲
歌手
推荐歌曲
周杰
伦
歌手
告白
气球
歌手
晴天
CREATE AI VIRTUAL LIFE FOR EVERYONE
48
49. 联想:信息提供
飞机
航空航天 波音
737 多国停飞波音737
交通工具 法拉
利 开法拉利卖红薯
交通工具 地铁 纽约地铁老鼠乱窜
CREATE AI VIRTUAL LIFE FOR EVERYONE
49
50. 知识存储
关系型数据库
全文索引数据库
CREATE AI VIRTUAL LIFE FOR EVERYONE
内存型数据库
RDF图数据库
文档型数据库
原生图数据库
50
51. 构建知识图谱的成本
How much is a Triple?
Estimating the Cost of Knowledge Graph Creation
Heiko Paulheim
Data and Web Science Group, University of Mannheim, Germany
heiko@informatik.uni-mannheim.de
CREATE AI VIRTUAL LIFE FOR EVERYONE
51
52. 高质量中文百科知识图谱:七律
实体数 230,255,525
关系数 3,049,384,022
https://ai.gowild.cn/kg
52
http://www.openkg.cn/dataset/7lore
53. 音乐技术:表现
CREATE AI VIRTUAL LIFE FOR EVERYONE
53
54. 音乐技术:表现
CREATE AI VIRTUAL LIFE FOR EVERYONE
54
55. 虚拟生命的发展阶段
虚拟生命1.0
计算机视觉、图像、声学等技术
的整合,以被动交互为主可进行
虚拟生命2.0
多模态技术的运用
虚拟生命3.0
超越人类的综合感知能力
单一数据源的推理及联想 更自然的双向交互 具备一定的自我认知能力 海量知识的联合推理及联想 建立对于用户的基本认知 自我信息的完全认知 完备的推理和联想
对用户的全面认知 具备自我意识
人类水平的自然交互
对个体及群体的完全认知
CREATE AI VIRTUAL LIFE FOR EVERYONE
55
56. AI虚拟生命的应用场景
在智能家居领域,AI虚拟生命在多设备中存在,
并进行互联,可以控制各种家电
智能家居
在教育领域,虚拟生命的形象和认知可以提升教
育体验。知识图谱可以帮助个性化学习和推荐
车载
教育
在娱乐领域,虚拟生命的形象赋能娱乐领域,提
供更丰富的表现力
在金融领域,虚拟生命可以让冷冰冰的机器人客
服更加友好
医疗
娱乐
在公安行业,结合知识图谱和自然语言交互,可
以发现海量数据中的蛛丝马迹。
在医疗领域,虚拟生命的形态、用户感知和情感
交互非常适合养老医疗,及安全监控等其他功能
公安
CREATE AI VIRTUAL LIFE FOR EVERYONE
金融
在车载领域,虚拟生命可以互连多设备,了解用
户行程,提供规划等
56
57. 多要素妥协
卖什么
卖给谁
怎么卖
产品
BOT
系统架构
功能闲聊问答
多模态交互
CREATE AI VIRTUAL LIFE FOR EVERYONE
性能
成本
软硬件
人力
市场
57
58. 商业模式
额,我这学期讲课压力太
大了,求夸。。。
刘老师在科研和教学的业余时间,还来夸清华的同学们,真是太
优秀了!
总所周知,清华相当一部分老师上课都是走个形式,刘老师为教
学质量牵肠挂肚,本身就已经超出了广大学生们对老师的期待
更何况老师在各大社交媒体上已经充分证明了自己的学术素养
与沟通能力,上台讲课也必然是手到擒来,虽然说略有紧张也
是人之常情,但却是不必太过担心,时间自然会证明刘老师的
课程的高质量、高水平、高回报
CREATE AI VIRTUAL LIFE FOR EVERYONE
刘老师不仅在学校孜孜不倦教书育人,还在知乎上为广大清华同
学排忧解难,成为知乎大V中的楷模,刘老师辛苦了!
58
59. 关于我们
Gowild
智能科技诞生
2013年12月
完成A轮融资;发布逗B机
器人”公子小白|青春版”,
与众明星亮相纽约时代广场
2016年06月
2016年01月
面向年轻人的情感社交
机器人“公子小白”发布
,线上销量位居第一
CREATE AI VIRTUAL LIFE FOR EVERYONE
?
琥珀·虚颜酷黑版上市
2017年09月
2016年07月
holoera×琥珀虚颜
全球首款人工智能3D全息主
机发布,二次元美少女琥珀·
虚颜生活在其中
完成A+轮融资;发布虚拟
生命第二代产品
2018年08月
2018年03月
发布公子小白成长版二代;
发布公子小白Pro版
2019年12月
2019年08月
Holoera+全职高手
59
60. 关于我们
Gowild人工智能研究院(上海)成立于2013年底,由多位业
界技术专家发起成立,包括国内NLP首位杰青获得者张民教授,
机器学习专家邵浩博士,知识图谱专家王昊奋博士,并汇聚美
国俄亥俄州大学、日本国立九州大学、加拿大女王大学、苏州
大学、浙江大学、华东师范大学等知名院校人工智能领域英才,
专注于知识图谱构建、自然语言处理技术、机器自我认知等研
究方向,推出Gowild AI Virtual Engine(GAVE)人工智能
虚拟生命引擎,成功应用于Gowild出品的Holoera及公子小白
系列产品。
CREATE AI VIRTUAL LIFE FOR EVERYONE
60
61. GAVE
CREATE AI VIRTUAL LIFE FOR EVERYONE
61
62. The Learning Pyramid
真的是真相么?
62
63. Gowild狗尾草智能科技
63