A Bi-directional LSTM Approach for Polyphone Disambiguation in Mandarin Chinese

摘要

普通话中的多音字歧义消除旨在为多音字从多个候选项中获取正确的发音。 它是人类语言技术(如文本到语音合成)的重要组成部分。 由于大多数多音字的发音可以根据文本中的上下文轻松决定,因此在本文中,我们将多音字消歧问题作为序列任务来解决。 具体而言,我们建议使用双向长短期记忆(BLSTM)神经网络来编码过去和未来对字符序列的观察作为其输入并预测发音。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-05 05:30
浙ICP备14020137号-1 $Map of visitor$