现代实时翻译重点.ppt

下载文档 降价啦

11
0
约2.33千字
约 22页
2017-03-22 发布于湖北
举报
版权申诉
保障服务

现代实时翻译重点.ppt

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机实时翻译实时翻译是一种软件即服务 (SaaS) 解决方案，集成了多种通信平台，可对在线聊天、论坛或社区讨论、博客等会话内容进行即时翻译。为了实现有效性，实时翻译技术需要在保持低成本的同时确保翻译后内容的质量对于组织而言有切实意义，以使其能够适当地满足客户需求。 Skype Translator——实时的可处理口语现象的翻译系统 Windows 8.1或Windows 10技术预览版的客户端、平板电脑客户端语音翻译支持四种语言（英语，西班牙语，中文普通话，意大利语）即时通讯文本翻译支持40多种语言关键环节：语音识别与机器翻译语音识别一直是近几十年来的重要研究课题，但是该技术的发展普遍被错误率高、麦克风敏感度差、噪音环境等因素阻碍。其识别错误率在1993年、2000年、2010年分别为100%、26%和7%，每一次进展都等待了数年甚至更久。 Skype Translator在语音识别中会对口语现象进行调整纠正，对文本断句加上标点，理想情况下在最后输出的文本和语音中会移除口语中出现的语气词，没有移除的部分可通过用户反馈得到进一步优化。机器翻译部分采用了和必应在线翻译同样的技术：开创性地结合了句法和统计模型，此外更加有针对性地训练对话性语言。系统在包含必应翻译的丰富语言知识的同时，还额外加入了口语对话中出现的单词及短语。 Microsoft Translator已经在俚语翻译方面拥有了不错的表现。这也帮助Skype Translator进一步提高了日常短语和术语的翻译能力。文本进入由机器学习建立的统计机器翻译系统中逐次逐句进行翻译，系统会从多个维度，比如说语言模型，翻译模型，调序模型对候选的译文进行打分和排序，最终输出一个最佳的翻译。这些模型需要使用海量规模的不同类型不同领域的数据进行训练。机器学习机器学习是指软件学习训练数据的能力。Skype Translator构建于强大的机器学习平台上。语音识别和机器翻译的训练数据来源多种多样，包括翻译的网页、配有字幕的视频，以及预先翻译且转录成文字的一对一谈话。 Skype Translator通过记录用户对话来分析对话文本并训练系统更好地“学习”各种语言。通过用户分享的对话记录，并对其进行了分析、统计模型创造训练数据，在准备好的数据被录入机器学习系统后，机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型。当用户说话时，软件会在该统计模型中寻找相似的内容，之后应用到预先“学到”的转化程序中，使得音频转换为文本再从文本转换成另一种语言。使用Skype Translator的用户都会在对话开始前得到清晰的系统提示，即对话将被录制并用于提高微软翻译和语音识别服务的质量。语音实时翻译的其他应用除了视频聊天，实时翻译技术还应用于网页翻译，手机翻译软件，字幕自动生成以及智能耳机等。网页实时翻译网页实时翻译除了可以使用翻译插件，常见的还有翻译网站，如登陆世界通等翻译网站，输入网址即可进行在线翻译。使用的其实是谷歌翻译系统。网页实时翻译采用必应翻译系统，点击YouTube播放窗口右下方的一个按钮观众就可以看到字幕，点击设置还可以将源语言翻译成所需要的其他语言。采用必应翻译系统，点击YouTube播放窗口右下方的一个按钮观众就可以看到字幕，点击设置还可以将源语言翻译成所需要的其他语言。谷歌翻译App “谷歌翻译”现在提供90种语言的文字翻译，并且能对几种常用语言进行听译。 “拍立译”或者即时视觉翻译（Word Lens）读取图片识别字符，凸出想要翻译的文字翻译重新渲染翻译文字 Waverly Labs公司推出了一款名为Pilot的智能耳机将Pilot智能耳机戴上后，用户听到的句子都能够传输到手机中，在手机完成计算机翻译之后，实时反馈到用户耳中。配套App使用谷歌翻译系统零售价：299美金 Pilot最大创新，就是将这个服务嫁接到了可穿戴设备当中，这样的配置能够让听者获得更好的使用体验，便捷程度和可使用性都更强了。总结目前比较成功的实时翻译项目都是是以三种关键技术为基础：语音识别（speech recognition）、机器翻译（machine translation）和文字到语音的转换（text-to-speech）。其中机器翻译基本使用的是微软必应翻译技术和谷歌翻译技术，必应是结合了句法和统计模型，谷歌翻译的工作本质上是基于多种语言的平行语料库，结合统计和数学方法，构建大数据分析模型挖掘各种语言间的内在规律。其本质是一种大数据分析模型，翻译结果则是基于训练好的模型，进行样本外预测泛化的结果。实时翻译的障碍主要在两个方面，一是语音识别过程中对口语现象的处理以及噪音环境的处理。二是机器翻译的准确度仍需要进一步提高。