小布虚拟人的多场景应用实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 小布虚拟人的多场景应用实践 OPPO小布助手首席架构师 万玉龙
2. 一 小布助手 2
3. 国内首个月活破亿的手机语音助手 2.5亿 1.3亿 20亿 覆盖设备数 月活跃用户数 月均交互次数 OPPO、OnePlus、Realme智能手机和IoT设备 的 内置AI助手 包含 语音、建议、指令、识屏 和 扫一扫 5大能力模块 “机智”、“有趣”、“温暖” 多设备、跨平台、多场景 3
4. 不断成长中的小布 首次发布 2018.12 跨界合作 2020.05 更名小布助手 月活破亿 2020.12 2021.02 营销/媒介创新 安全性/可靠性/隐私性 2021.06 4 多模态交互 3周年IP升级 2021.09 2021.12
5. 二 虚拟数字人 5
6. 线上用户需求分析 高级 高级需求 情感诉求 进阶需求 智能、懂我 基础需求 方便、高效、解放双手 朋友 助手 工具 • 形象拟人化,声音、动作、表情丰富自然 • 对话交流直击用户内心,满足情感需求 • 单指令执行APP二级指令复杂任务 • 结合对情景智能和用户理解主动建议 • 查天气,系统设置,播音乐等 • 更多提高操作效率的功能 基础 6
7. 虚拟助手行业趋势 7
8. 虚拟助手行业趋势 8
9. 智能交互技术发展 多模态交互 计算机视觉 多模态驱动 语音交互 触屏交互 文字交互 • • • 触屏 语音合成 自然语言理解 自然语言理解 自然语言理解 知识图谱 知识图谱 知识图谱 以文本形式与用户交互 依赖用户双手输入文本 以文本展示给予用户反馈 • • • 语音识别 语音识别 以触屏方式与用户交互 依赖用户手部接触 通过GUI给予用户反馈 • • • 9 以语音形式与用户交互 释放双手,一语即达 通过VUI给予用户反馈 语音合成 自然语言理解 知识图谱 • • • 以虚拟人形态与用户交互 释放双手,一语即达 通过语音、表情、手势、 动作等给予用户反馈
10. 虚拟数字人 • 设备:显示屏(2D/XR),全息投影 虚拟 • 场景:虚拟助手,虚拟主播,数字员工 非物理世界 数字 • 建模:数字建模(CG) 技术驱动 人 • 驱动:动捕驱动,AI驱动 外观/行为/智能 10 • 形象:卡通-写实-超写实 • 行为:动作、表情、声音等 • 智能:能感知,可交互
11. 三 小布虚拟人 11
12. 首个基于虚拟人多模态交互的手机智能助手 12
13. 两套技术方案 真人驱动 设备捕捉 算法驱动 AI捕捉 形象设计 真人数据采集 3D建模 驱动参数训练 关键点绑定 驱动参数预测 动作捕捉参数 录音采集 驱动渲染 变声器 虚拟人影像 虚拟人 13 语音合成
14. 主体制作 形象设计 3D建模 关键点绑定 14
15. 真人驱动 惯性 动捕 动捕 软件 渲染 引擎 光学 动捕 15
16. 算法驱动 文本特征 动作预测模型 动作系数 Word Embedding 渲染 引擎 “大家好,我是布美美” 语音 合成 话术文本 音频波形 音频特征 元辅音识别模型 16 元/辅音 Blendshape 虚拟人驱动
17. 对话式虚拟人架构 语音唤醒 知识图谱 自然语言生成 人声检测 语音识别 声音播报 对话平台 语义理解 技能平台 语音合成 虚拟人SDK 虚拟人交互服务 3D渲染引擎 唇形生成 17 表情生成 动作生成
18. 四 未来可期 18
19. 两种产品形态 数字备份 电商主播 社交游戏 品牌代言 代表我 服务我 元宇宙入口 虚拟助手 虚拟会议 虚拟偶像 19
20. 三大发展趋势 高智能 用高精度的语音识别、声纹识别、情绪识别、对话理解、 高保真 4D高精度扫描&超写实3D建模,塑造高仿真虚拟人外形 低成本 素材标准化+AI算法,降低美术素材制作&绑定成本 知识图谱等技术赋予虚拟人更强的智能感知力 高精度动捕&深度学习,生成流畅、自然的人物动作 开放形象定制能力,通过智能AI捏脸等降低开放定制成本 用高表现的语音合成、计算机图形学、唇形生成、动作生 成、表情生成等技术赋予虚拟人更好的情感表达力 4D高精度扫描&丰富面部数据学习,还原多情感生动表情 20 从专家定制走向用户定制,实现千人千面个性化
21. 数据驱动体验升级 21
22. 科技为人,以善天下

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-16 09:51
浙ICP备14020137号-1 $Map of visitor$