机器翻译中机器学习技术应用研究.docVIP

下载本文档

13
0
约5.51千字
约 11页
2018-12-07 发布于福建
举报
版权申诉

机器翻译中机器学习技术应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器翻译中机器学习技术应用研究

机器翻译中机器学习技术应用研究　　【摘要】本文论述以实例归纳和以类比归纳为手段的机器学习技术原理，分析基于类比的机器学习相关理论，从完全实例翻译、实例句型转换翻译、类比近似翻译等方面研究机器翻译中类比机器学习技术的应用，旨在进一步优化机器翻译的智能技术。　　【关键词】机器翻译机器学习技术应用　　【中图分类号】G 【文献标识码】A 　　【文章编号】0450-9889（2018）08C-0190-03 　　随着我国科学技术的不断革新，越来越多产品的智能功能为人们的工作生活提供了更多的助力与保障，机器翻译正是重要的智能化功能之一。现如今，机器翻译软件正不断涌现，大多遵循自然语言处理规则。要想在翻译质量和效率上做到精益求精，应对语言中的各种歧义展开准确处理，提高翻译速度，同时还应该加强机器翻译的拟人化，不断增强机器对人类语言的认知。因此，加强机器学习技术的研究非常重要，坚持让机器学习的技术应用来帮助机器掌握自然语言的不同歧义，是一个重要的研究课题。　　一、机器学习技术简述　　机器学习方法的目的在于帮助计算机等机器能够不断优化程序，进而按照人类的思维在面对不同问题时可以搜集历史数据，增强对问题的全面思考，提高复杂逻辑的准确度，图1所示代表了机器学习与人类思考之间的机制吻合。　　基于实例的机器学习技术，在于为程序设定特定目标概念的正确例子或错误例子，程序经过理性分析归纳，形成相对完整的概念体系，从而面对新的例子中能够识别正确，排除错误。基于类比的机器学习技术，是更接近于人类思维和行为习惯的重要学习方法，简言之就是对不同事物个体之间所存在的相似关联性进行比较和辨识。一旦新问题出现后，主导程序仍然会快速回顾并梳理历史数据，对于曾经处理过的类似案例进行排列分析，可从中挖掘与当前问题最为相似的处理方案来参考解决新问题。　　二、基于实例的机器学习　　（一）技术思路　　基于实例的机器学习可设置为单次行为，也可设置为累积行为。在单次行为中，无论是正确的例子还是错误的例子都应一次性显示；在累积行为中，系统程序则更容易在有用数据库中分多次假设案例概念，并在陆续添加案例的过程中不断修正和调整概念假设，从而使得例子所代表的准确度更高。实例累积的机器学习行为以仿人类学习思维为目标，并在技术上致力于无限接近与人类的学习能动性。一旦机器学习启动，处理程序将会梳理已掌握的各种理论概念，这些概念可以直接进行内涵与外延的拓展，也可以帮助程序引导实现新的案例。机器操作人员在编写新程序的过程中，可以在已掌握概念的基础上，完成对新概念基本点的描述。从实践效果看，累积行为比单次行为的准确度更高，单次行为往往在重塑概念的过程中会选择一定比例的错误例子，这样并不利于机器的有效学习。　　基于例的机器学习应以归纳思维为主，尽可能完成对案例对象的一般性描述。所谓机器学习中的归纳学习系统模型转换过程，如图2所示。　　图2 机器归纳学习的系统模型示意图　　所谓一般性描述，即能够对各种输入数据进行必要的解释，并根据解释行为结果来推算新信息。机器程序的编写中，需要将一般性描述使用某种规范性的描述语言变得更加形式化。只要涉及不同的数据输入或描述语言，就能够以形式化的一般性描述来概括，随之形成更有约束性与代表性的关系描述集合，整个集合的最小元素都能在特定的描述语言中看作是特点输入值，而集合的最大元素就称之为是代表性的一般描述。故而按惯例可先描述特征输入值，再以归纳手段组织完成一般描述。　　（二）基于案例的问题描述　　通常，脚本、框架、层次结构、规则产生、语义结构、推演网络等都可以用来进行事件问题描述。其中，微词演算的方法更为严格，其产生的语法语义也更为精巧。当前不少人工智能的归纳学习都倾向于沿用谓词演算的方法，人们在相关归纳动作的理论问题上得到了更多的研究实践经验。当然，很多学习方法对于如何进行一般性描述的形式进行了约束。如在某学习系统虽然理论上能够直接描述，但并未构建描述机制。　　（三）基于案例的机器学习执行规则　　对一般性差异化半序描述体而言，可指明由非一般描述转为一般性描述的具体方法。这就需要进行必要的归纳分析与逻辑推理，应对整个语言描述中的初始量与中间量制定一般性执行规则，即称之为转换规则。逻辑上可表述为：若一般规则可执行分类规则出现S1∶∶K时，会产生更为普遍的分类规则S2∶∶K2，则S1→S2的推导成立。S2与S1之间的描述字符或量化值相对比后，若前者描述内容全部映射在后者描述符中则称之为选择性规则，若前者描述内容在完成对应映射外还有其他描述符则称之为构造性规则。由此可见，出现构造性规则将意味着一般性描述空间的变化，而选择性规则没有空间变化异象。　　降低条件规则的做法，实属一般性规则的低级操作，主要靠降低合取条