人工智能真的可以取代同传翻译?

苏宁金融研究院
关注

第一个技术难点是语音识别。近二十年来,语音识别技术取得了显著进步,开始进入家电、汽车、医疗、家庭服务等各个领域。常见的应用系统有:

语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;

语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;

智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、旅行社服务系统、订票系统、银行服务等。

可以说,语音识别技术与其他自然语言处理技术相结合,可以构建出很多复杂的应用。

然而,语音识别的主要难点就是对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。由于语音信息量大,语音模式不仅对不同的说话人不同,对不同场景的同一说话人也是有差异的。

例如,一个人在随意说话和认真说话时的语音特征是不同的。另外,说话者在讲话时,不同的词可能听起来是相似的,这也是常见现象。单个字母或词、字的语音特性,受上下文的影响,以致改变了重音、音调、音量和发音速度等。最后,环境噪声和干扰对语音识别也有较大影响,致使识别率低。

第二个技术难点是语义解析,这是智能化的机器翻译系统的核心部分。目前,机器翻译系统可划分为基于规则和基于语料库两大类。前者以词典和语言知识规则库为基础;后者由经过划分并具有标注的语料库构成知识源,以统计学的算法为主。

机译系统是随着语料库语言学的兴起而发展起来的。目前,世界上绝大多数机译系统都采用以规则库为基础的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机译系统,由不同的成分构成。抽象地说,所有机译系统的处理过程都包括以下步骤:对源语言的分析或理解,在语言的语法、语义和语用等平面进行转换,按目标语言结构规则生成目标语言。

当前,Google 的在线翻译已经为人熟知,其第一代的技术即为基于统计的机器翻译方法,基本原理是通过收集大量的双语网页作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。

不过,采用该技术目前仍无法达到令人满意的效果,经常闹出各种翻译笑话。因为,基于统计的方法,需要建立大规模的双语语料库,而翻译模型、语言模型参数的准确性直接依赖于语料的规模及质量,翻译质量直接取决于模型的质量和语料库的覆盖面。

除了上述传统的方式,2013年以来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译逐渐兴起。就当前而言,广泛应用于机器翻译的是长短时记忆循环神经网络。该模型擅长对自然语言建模,把任意长度的句子转化为特定维度的浮点数向量,同时“记住”句子中比较重要的单词,让“记忆”保存比较长的会话时间。该模型较好地解决了自然语言句子向量化的难题。

其技术核心是通过多层神经网络,自动从语料库中学习知识。一种语言的句子被向量化之后,在网络中层层传递,经过多层复杂的传导运算,生成译文。这种翻译方法最大的优势在于译文流畅,更加符合语法规范。相比之前的翻译技术,质量有较高的提升。

智能同传翻译离我们还有多远?

需要说明的是,很多人对机器翻译有误解,认为机器翻译偏差大。其实,机器翻译运用语言学知识,自动识别语法,模拟语义理解,进行对应翻译,因语法、语义、语用的复杂性,出现错误是难免的。就已有的成果来看,全场景通用的机器翻译,其翻译质量离终极目标仍相差甚远。

随着全球化网络时代的到来,语言障碍已经成为二十一世纪社会发展的重要瓶颈,实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。这仅是全球化背景下的一个小缩影。在社会快速发展的进程中,机器翻译将扮演越来越重要的角色。

来源:苏宁财富资讯;作者:苏宁金融研究院金融科技研究中心副主任 沈春泽

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存