小数据量语音合成技术在作业帮的应用

出处：mp.weixin.qq.com

摘要

语音合成是将文字内容转化成人耳可感知音频的技术手段，传统的语音合成方案有两类：基于波形串联拼接的方法和基于统计参数的方法。随着深度学习的发展以及计算能力的不断提升，基于神经网络的语音合成方案逐步成为语音合成领域的研究热点。

相较于传统的语音合成方案来说，基于神经网络的语音合成技术最大的特点就是结构简单。端到端的语音合成方案可以直接输入文本或者字符，合成系统就能将与之对应的音频波形直接输出，降低了开发者对语言学和声学知识的掌握要求，同时该方案下生成的音频无论拟人化程度，还是对原始录音数据情感风格的还原情况都远优于传统方案。

阅读原文

xiaozi 于 2022-11-17 分享

5904

关联话题： #作业帮 #BERT

欢迎在评论区写下你对这篇文章的看法。

小数据量语音合成技术在作业帮的应用

小数据量语音合成技术在作业帮的应用

摘要

评论

文库