小度机器人为计算语言学国际年会ACL“同声传译”
“我们想进一步把人和计算机联系起来,就要对人的自然语言进行处理,所以我对自然语言处理产生了兴趣。”“If we want to further contact human and the computer, we‘ll have to deal with our natural language first. So I was interested in NLP.”在国际会议上,翻译并不少见,然而如果说这个翻译不是人类,而是一个机器人呢?在7月29日ACL年会上,中国中文信息学会理事长李生教授凭借几十年来在机器翻译等方向上的杰出成就和贡献,获ACL终生成就奖,成为了世界上首位获得该奖项的中国科学家。在李生教授与台下嘉宾的问答环节里,小度机器人作为机器翻译成果的展示,承担了“同声传译”的职责,现场将李生教授的中文回答翻译成英文。对语义的理解以及准确流畅的翻译,令小度机器人惊艳全场。
百度一直在机器翻译、语音识别、深度问答等多个人工智能领域进行探索和布局,而小度机器人则被视为百度在人工智能领域的探索先锋。此前,在第十届中国电子信息技术年会上,百度更将机器翻译与语音识别完美结合,令小度机器人成功实现了中、英、日、韩多语实时翻译,获得多位人工智能、计算机翻译领域海外知名学者的好评。
此番小度惊艳亮相的机器翻译技术,一直被公认为是人工智能领域最难攻克的问题之一。机器翻译顾名思义就是要让机器实现跨语言翻译的功能,人类语言自身的复杂性以及不同语言之间的差异性决定了机器翻译问题的难度。
据悉,今年百度机器翻译项目在海量翻译知识获取、翻译模型、多语种翻译技术等方面取得最新突破,解决了传统方法研发成本高、周期长、质量低的问题。通过海量自然语言语料库,让机器自动学习理解不同单词、短语和句式,然后进一步优化自身系统,并突破了“消歧”和“调序”等难题;基于互联网大数据的翻译模型,实时准确地响应多文体、多领域的复杂翻译请求;基于枢轴语言的翻译技术,使得资源非常稀缺的小语种翻译成为可能,且实现了多语种翻译的快速部署。
此外,小度机器人的翻译能力还依赖百度研发的基于深度学习的翻译模型。百度利用海量网页库资源,挖掘了数以亿计的双语句对,作为模型训练的数据。这个数据规模如果按照字数换算成《大英百科全书》,翻译系统在一周内学习的内容相当于千万部《大英百科全书》。机器实现了类似人脑“理解语言,生成译文”的思维过程,相比之前的翻译技术,如今的译文更流畅,翻译质量有了“跃进式”提升。
ACL首位华人主席、百度技术副总裁王海峰博士表示:“搜索的本质就是连接人与信息、人与服务。机器翻译能更好地把人和多语言的信息和服务连接起来,采用机器翻译技术自动实现语言之间翻译是人工智能的终极目标之一。
跨界又出新 新明珠进军工业机器人领域
建陶行业跨界又出新,作为国内建陶行业领军型企业,新明珠陶瓷集团联合新润成陶瓷等企业,发起成立广东丽柏特科技有限公司(下称“丽柏特”)。
事实上,旗下拥有13个品牌的航母式陶企新明珠,近年曾先后进军红酒、金融、房地产等行业,开展多元化业务。但有别于这些领域,对于进军机器人行业,近日新明珠集团副总裁简润桐在接受媒体采访时表示,终端市场的厮杀压力下,陶业智能制造是必然趋势。成立主攻陶业自动化改造的丽柏特,一方面是助力新明珠自身加快实现智能制造,同时也希望推进行业更快地迈向工业4.0。