爱奇艺多语言台词机器翻译技术实践

摘要

2019年6月,爱奇艺正式推出服务全球用户的产品iQIYI App,并通过中台系统为iQIYI App提供全球化运营支持,由此开启了海外市场布局之路。作为影视内容服务商,其中必然涉及大量长视频,而长视频的出海,重要的一环就是台词翻译。

目前,爱奇艺已在多个国家布局,涉及多种语言的台词翻译,主要有泰语、越南语、印尼语、马来语、西班牙语、阿拉伯语等等语言,这就使得多语言翻译成为了迫在眉睫的现实需求。

此外,与通用翻译相比,台词翻译有一些独有的特点如:

(1)台词一般句子较短,上下文信息不足,歧义性大;

(2)很多台词来源于OCR或ASR识别的结果,会有错误,可能影响翻译质量;

(3)在台词对话中往往会涉及很多人物的指代,故而角色名和代词的翻译对于台词翻译来说尤为重要;

(4)部分台词需要结合视频场景信息才能进行语义消歧。

正是爱奇艺海外多国布局的现实需要以及台词翻译的独有特点这两大因素使得台词场景下多语言机器翻译实践成为现实。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.123.1. UTC+08:00, 2024-03-29 00:50
浙ICP备14020137号-1 $访客地图$