流式和离线语音场景下 VAD 语音端点检测算法实践
摘要
近年来,AI智能语音应用在58同城广泛落地。无论是智能语音交互平台还是“灵犀”智能语音分析平台,都需要对电话语音进行处理分析,服务上层应用。如果把音频信号比作水流,语音端点检测(VAD, Voice Activity Detection)就是控制水流的阀门,其结果决定了系统的后续动作。
本文主要讲述了58自研的VAD系统在流式、离线两大场景中的实践过程,第一部分简单介绍这两大场景,第二部分是对VAD算法的一个概述,第三、第四部分分别描述了流式、离线场景中遇到的不同问题以及解决方案,第五部分是评测结果,第六、第七部分是总结和参考文献。
欢迎在评论区写下你对这篇文章的看法。
评论
据说喜欢分享的,后来都成了大神
提交句子
“那些出身好能力强的人努力是为了成功,因为人家有可能会成功。我们努力是为了啥呢?”“为了活下去。”
文库
- 1 From Predictive to Generative – How Michelangelo Accelerates Uber’s AI Journey
- 2 Scaling PayPal’s AI Capabilities with PayPal Cosmos.AI Platform
- 3 No version left behind: Our epic journey of GitLab upgrades
- 4 网易云音乐用户行为归因数据体系建设
- 5 高铁和站台为什么有缝隙,不能并上吗
- 6 双十一技术攻略(三): 熔断实战
- 7 扒一扒隔离熔断之Hystrix VS Sentinel
- 8 Hystrix 源码分析及实践
- 9 Guava Cache的缓存管理与使用
- 10 Guava Cache 原理分析与最佳实践
- 11 QunarCache的应用
- 12 用逻辑驱动设计创造可持续的产业增长
- 13 为什么你能感觉到背后有人盯着你
- 14 B站数据中心网络布线智慧管理平台实践(一)
- 15 喜马广告算法优化实践(四):广告系统漏斗优化