投融君

欢迎来到我的金融界博客

博文 字体:

神经机器翻译再掀革命 语言服务行业寒冬来临?

  [2017-01-11 11:52:30] 

专业翻译与本地化服务公司Lionbridge在其网站上刊文,将机器学习的进步视为语言服务行业激动人心的消息。

人工智能和神经网络应用于复杂自然语言处理,比如语音识别和机器翻译,正在导致快速的进步。例如,在今年10月份,微软宣布,他们的语音识别系统能够像人类一样理解语音对话。

谷歌的神经机器翻译(Neural Machine Translation)在最近名声大噪。前不久纽约时报刊登一篇名为“The Great Awakening”(大觉醒)的文章来阐述人工智能程序的进步,并且强调了它在自动语言翻译中的应用。

对比统计机器翻译(Statistical Machine Translation),谷歌的神经机器翻译优势明显,翻译效果更加流畅也更符合语法。

这一段时间谷歌翻译的新闻广为报道,但我们不能就此以为这个领域只有谷歌一家。微软、百度、Systran和其他多家公司都在发展神经网络机器翻译(Neural MT)。从最初的规则翻译(rules-based MT)到后来的统计翻译(Statistical MT),再到现在的神经网络,机器翻译的更新迭代日新月异。

神经网络机器翻译的短期效应:更广泛和更有信心地应用机器翻译

随着机器翻译质量不断提高,后编辑(post-edit)的成本会越来越低。特别是对一些复杂语言和传统上认为不适用机器翻译的领域来说尤其如此。使用神经网络翻译来提高翻译质量,其后编辑为用户提供的单词呈现爆炸式增长。

机器翻译系统的表现取决于:(a)训练材料的质量和数量,(b)机器学习算法的复杂性以及(c)未来要翻译的文本与训练材料之间的相似性。训练材料对机器翻译系统的影响至关重要,如果训练材料中未能充分反映新内容,系统表现将远称不上完美。

即使提高基线质量,在用小数据对神经网络系统进行训练之后,仍需对机器翻译的输出结果进行专业审查和校正。专业人员的参与在训练和输出两头的参与都很重要。

机器翻译并非故事的全部

本地化行业正在经历一个在很多行业业已发生的转型。在过去的五到七年里,由于出版内容的变化,文件体积迅速变小。最终结果造成交易成本大于翻译成本。

系统从客户存储库获取内容,将其通过机器或人工——或是两者结合——翻译成多种语言,经过质量评审之后交予客户。整个过程全自动化,智能系统将内容分割成小块进行分工处理,保证翻译过程的高效。

随着行业向多语言沟通的发展,对智能基础设施的需求变的更加重要。内容必须被系统理解,然后通过正确的工作流程,组装成正确的部分。当需要人工介入时,能够传输给正确的工作人员。

如上所述,只有科技巨头才有能力负担起行业规模的投资。用分节段的方式管理本地化生命周期,从任何客户存储库接受内容,根据不同需求进行处理,根据可配置的业务规则进行分块,然后实时交予正确的人工操作。

科技巨头将过程自动化和劳动力成本的降低视为自己的优势所在,并且认为随着机器翻译质量的提高,这个平台的价值将更加彰显。

微信朋友圈 生成长微博
阅读(72)收藏(0)
网友评论 已有0条评论
500/500

个人资料

博客等级:2

博客积分:1640

总访问量:5671

文章总数:41

实盘直播

网站导航| 关于金融界| 广告服务| 产品与服务| 合作伙伴| 法律声明| 人员招聘| 征稿启事| 意见征集| 联系我们| About Us

Copyright © JRJ.COM Inc. All Rights Reserved. 版权声明