声音基础模型如何推动声音理解和生成
如果无法正常显示,请先停止浏览器的去广告插件。
1. 小米的声音世界
-- 声音基础模型推动声音理解和生成
小米技术委员会AI实验室/
王育
军
2.
3. 摘要
• 小米为什么做AI声学语音
• AI声学语音的技术和应用
• 声音基础模型赋能声学语音
4. 2023
360
5. 小米为什么做人工智能
(软件+硬件)^AI
6. 人车家全生态
汽车 手机 X AIoT
7.
8. 智能手机销量全球Top3
9. AIoT
10. 把业务技术装在AI的篮子里
11. 声学语音算法体系
12. 小爱同学语音交互
79品类
1.36亿
5829款
6亿
2亿
13. 拾音降噪
14. 拾音降噪
15. 声音情境感知
16. 视觉抠音
17. 跨设备声纹
18. 聆听
个性化语音识别技术提升言
语障碍用户体验
2020小米黑客马拉松冠军
19. 语音生成
雷总语音祝福
这一次,雷总喊出了
18w+ 米粉的名字
20. 声音基础模型
CED
21. Xiaomi Dasheng
Deep Audio Signal Holistic Embeddings
1.2B
27万小时
22. Xiaomi Dasheng
Deep Audio Signal Holistic Embeddings
23. 把AI装到大模型的篮子里
24. Dasheng的应用 SCAR
Sound Component Analysis & Reconstruction
相册声音橡皮擦
提取人声
原始视频
提取环境音
25. 大模型语音合成
26. Unified Model
27.
28.