“机器翻译”会抢同声传译的饭碗吗？

　　随着科技和社会经济的快速发展，全世界的互联互通已经成为不可阻挡的发展趋势，那么不同国家之间如何实现低成本的有效交流呢?

　　人工翻译所耗费的成本巨大，也许最好的解决方法就是：充分利用机器翻译技术提供智能自动翻译服务。

　　机器不会累、学习快，一个系统同时掌握十几种语言互译也不是问题，也许永远不会像人一样出现翻译盲点。　

　　但是语言的复杂性众所周知，人尚且会有误解的时候，那么冰冷的机器究竟是怎么翻译一种语言的呢?它会思考吗?

　　今天，就让讯飞带领大家一起走进“机器翻译”的世界。

　　目前机器翻译的主流方式叫“统计翻译”。　

　　统计机器翻译的基本原理是：从语料库大量的翻译实例中自动学习翻译知识，然后利用这些翻译知识自动翻译其他句子。

　　比如，为了让机器顺利实现中英文之间的翻译，首先需要收集大量中英文双语句对，然后使用计算机从这些双语句对中统计并学习翻译知识。

　　看到这里你也许会觉得，机器翻译好像也不难，不就是要收集到足够多的词汇和例句吗?

　　当!然!不!是!　

　　让机器学习翻译知识可不是一件简单的事。

　　人类语言具有很大的复杂性。首先，很多用词和表达方式是多义的、模糊的、跟特定应用环境相关的。即使是同一个句子，在不同语境下的意思也不相同。例如，碰到这样的情况，不仅仅是老外，机器估计也会“迷茫”。　

　　其次，不同语言的语序也不一样。例如“最好的朋友之一”，翻译成“one of the best friends”，其中“之一”的翻译被提前了。

　　再者，对于同一个句子，它可能有很多种正确的翻译方法。这样增加了机器学习过程的不确定性。例如“你好”可以被翻译成“Hello”，或者“How do you do”等。

　　因此，一个优秀的机器翻译系统，对于词的翻译知识，短语的翻译知识、语法结构的翻译知识、语义的翻译知识等等全部都要掌握。

　　以中英翻译方向为例，系统首先要掌握中英文之间词、短语、语法结构的翻译知识。有了这些翻译知识之后，系统就会把这个中文句子切分成各种词、短语、或者语法结构的组合(这个过程中，有成千上万种切分可能，每个单元也有多种翻译备选)，然后分别翻译每一个单元，最后组合起来形成最终的英文翻译。

　　万万没想到吧，在电光火石的一瞬间，系统已经经历了这么一个“千回百转”的过程。

　　近几年，谷歌、微软、IBM、百度、科大讯飞等国内外科技企业都成立了机器翻译团队从事此项研究，矢志打破语言障碍。机器翻译技术也在飞速发展，微软在skype上应用同声传译技术让人大呼“逆天”，去年的国际机器翻译(IWSLT)比赛直接采用了TED演讲的真实语料，在口语化严重、专业名词多的情况下，参赛队伍依然表现不错，科大讯飞更是在中英和英中两个翻译方向均获第一。

　　随着机器翻译技术的进步，另一种担心也在悄然蔓延：“机器会抢同声传译的饭碗吗?会让从事这一行业的人类失业吗?

　　(图：应用于skpye的翻译技术让两个不同国家的人实时沟通。)

　　我们认为，担心这个问题还为时尚早。虽然现在可以通过一些实用的技术让机器去模拟人的智能活动，模拟人对语义的理解。但相对于彻底的人工智能和语义理解，还有相当长的道路。如果有一天机器真的能够实现准确的实时翻译，它们的角色更可能是辅助相关产业的工作人员更轻松、便捷地开展工作，而不是取代他们。

　　技术的发展会让人类的生活更加便捷、美好，期待全球沟通无障碍的时代早日到来!　

时间：2015-06-04 14:58:37 来源：评论：0 点击：

延伸阅读：

热门排行

图片新闻

推荐新闻