三体社区泛科幻大本营

注册

只看楼主

哆啦A梦的“翻译魔芋“将面世?

烽火夜羽 发表于 2015-4-10 16:27:37 [ 上一主题] [下一主题]

本帖最后由 烽火夜羽 于 2015-4-10 16:30 编辑

挑战实时语音翻译:你讲英语,我听中文

很多人很头疼翻译这个事儿,毕竟不是每个人都是外语大神。尽管有了互联网后,我们的翻译工作轻松了不少。像Google翻译们希望通过更精确的算法来改进机器翻译的质量,不过算法的改进是远远赶上不上语言的灵活性和变化性,面对机器翻译结果的不知所云,只能长叹一声,这货还是靠不住。

这时你就会想到哆啦A梦。哆啦A梦有一个四次元口袋,里面装满了各种各样神奇的道具。对于广大译者来说,没有什么道具比“翻译魔芋”更吸引人了。

1348820638374.jpg

只要食用过“翻译魔芋”,不同语种之间的人类(甚至外星人等非人类种族)都可以畅通交流。现在“翻译魔芋”总算被日本人鼓捣出来了,尽管不像哆啦A梦的“翻译魔芋”一样神奇,但至少先缓解了你的翻译烦恼。


rdn_51f6fff7465cb.jpg

类似于电影《星际迷航》里科克船长(由威廉·夏特纳(William Shatner)饰演)和老骨头(由德福雷斯特·凯利(DeForest Kelley)饰演)所使用的设备。

今天,具备实时语音翻译技术的Skype 翻译器(Skype Translator)中文预览版正式在中国市场推出。这一凝聚微软在语音识别、自动翻译和机器学习等多领域成果的产品,将使英文和中文普通话之间的实时语音对话成为现实。

基石:机器学习

这个实时语音翻译功能的实现,有赖于强大的机器学习平台。机器学习是指软件学习训练数据的能力。语音识别和机器翻译的训练数据包括翻译的网页、配有字幕的视频,以及预先翻译且转录成文字的一对一谈话。Skype Translator通过记录这些对话来分析对话文本并训练系统更好地“学习”各种语言。

和滚瓜烂熟的朗诵不同,口语交流中常常会出现不流利的情况。人们在说话时会停顿、重复,并伴有“嗯”“呃”“啊”之类的语气词。我们的机器学习模型针对以上问题会相应处理这些停顿。在预览版中,用户可以看到咦部分语气词停顿被移除,而没有被移除的部分则可能通过用户反馈进行再优化。

Skype翻译器开创性地结合了句法和统计模型,并更有针对性地训练对话性语言的输出。图片来源:skype.com

通过去除造成不流利的字词、将文本分解成句子、添加标点符号和大小写识别,软件可以实现更好的识别和翻译。而利用在预览版阶段获取的训练数据,软件能针对真实使用者的不同话题、口音与语言转换进行学习。

在准备好的数据被录入机器学习系统后,机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型。当用户说话时,软件会在该统计模型中寻找相似的内容,之后应用到预先“学到”的转化程序中,使得音频转换为文本,再从文本转换成另一种语言。

另外,研究团队也创造了一个定制化的机器人程式来协调整个产品体验。它负责建立电话连接、发送音频流至语音引擎获取翻译文本,并分别在双方结束说话时翻译其所说的内容。

迈向未来的新体验

经过多年的专注投入,微软在北京和美国雷蒙德的团队合作完成了普通话的语言模型,而得益于深层神经网络与统计机器翻译技术的结合,语音识别能力被进一步提高,翻译结果不断准确化,让一对一的语音交谈成为现实。在中文预览版中,用户可以体验到令人讶异的新功能:

  • 语音读取文字信息:用户可以通过语音收听到对话方发送给自己的即时消息,语音的语言可以自选。
  • 持续性识别:在对方发送语音信息期间可持续性的进行文字翻译。
  • 自动声量控制:对话方可以在实时语音翻译期间不间断地说话,同时用户可收听到较高音量的语音翻译,而对话方本身的语音信息呈现出较低音量
  • 语言翻译静音功能:用户可以任意开启或关闭语音翻译的声音,并直接读取文字翻译。


当听见一口流利的中文从外国友人的“口中”传出时,可以想象人们内心的惊喜与激动。图片来源:Youtube.com

此前数十年,语音识别的发展一直受到错误率高、麦克风敏感度差异、噪音环境等因素阻碍。微软研究院率先将深层神经网络(DNNs)技术引入语音识别,极大程度地降低了错误率,提高了可靠性,最终使这项语音翻译技术得以更广泛地应用。

从现在开始,中英实时语音翻译的大幕已经拉开,世界上使用人数最多的语言和世界上使用最广泛的第二语言将能直接展开对话。相信随着产品的不断优化,跨语言无障碍交流的时代终将来临。(编辑:Calo)


信息来源:微软亚洲研究院
文章题图:skype.com


回复 点赞(1)

所信者目也.而目犹不可信;所恃者心也,而心犹不足恃

三体世界威武 发表于 2015-4-14 12:00:33

沙发

这玩意挺有用的 希望以后翻译技术越来越好吧

点评 引用回复 点赞(0)

提示:close

 

已赞!

 

提示:close

 

已关注!

 

您需要登录后才可以回帖 登录 | 立即注册

关注我们新浪微博微信 3

  

沪ICP备14049458号    网站地图

Powered by Discuz! X3.2@2001-2013, Comsenz Inc 版权信息

更多友情链接

钛度社区 3G小说网 磨铁中文网 创世中文网 网易原创 起点中文网 潇湘书院 红袖添香 小说阅读网
科幻世界 书海小说网 纵横中文网 科幻星云网

快速回复 返回顶部 返回列表
close