软件安全中结合语义的机器学习方法探讨.docVIP

下载本文档

8
0
约2.7千字
约 5页
2016-09-16 发布于北京
举报
版权申诉

软件安全中结合语义的机器学习方法探讨.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

软件安全中结合语义的机器学习方法探讨.doc

软件安全中结合语义的机器学习方法探讨　　摘要：近年来，在计算机信息技术发展的同时，各种类型的软件已经被广泛地应用在社会生活和生产当中的多个领域。然而，在长期的发展过程中，信息系统的漏洞逐渐突显出来，病毒的种类也处于动态的变化过程中，所以，软件安全已经成为当前所需考虑的难题。而在此背景下，机器学习快速发展，并且在多个领域都被广泛应用。　　关键词：软件安全结合语义机器学习方法探讨　　中图分类号：TP393.08 文献标识码：A 文章编号：1007-9416（2016）06-0229-01 　　1 软件安全现状分析　　目前阶段，软件安全存在诸多问题与缺陷。其中，网络仿冒事件以及网页的恶意代码事件频繁出现，并且增长速度不断增加。很多网站都被黑客入侵，或者是被植入了木马攻击程序，导致信息系统的安全漏洞逐渐增加。这一现象导致软件的安全受到威胁，并且严重影响其在多领域多行业中的正常使用。要想积极地转变这一情况，就一定要采取相应的方法并及时予以解决处理，保证软件安全程度的提高，进而确保软件能够为人们提供更加安全的服务。　　2 机器学习策略　　2.1 机械学习　　在机器学习的过程中，无需进行推理或转换知识，可以对周围环境所提供的信息内容进行直接地吸收，并且实现信息简单存储。这种学习策略是最基本的，以塞缪尔跳棋程序与西蒙LT系统为例，这些都是机械学习范围[1]。在开展机器学习的时候，仅仅需要根据软件所编辑好的程序进行学习就可以，不许对输入信息内容让进行推理。然而，该学习策略仅仅适用于环境比较稳定或者是具备固定输入、输出模式的系统当中，对于环境要求很高。　　2.2 示教学习　　该学习策略也被称作传授学习或者是指导式学习，不仅需要在环境方面投入大量工作，同时，需要保证机器学习具备推理能力。该策略具体的过程就是：对指导者提出建议请求，并在接受建议的同时，有效地转化成内部表现形式。而后，转化成具体知识内容，并且将获得的新知识纳入知识库当中，最后应采取相应的方法评价并检验新的知识。　　2.3 演绎学习　　这种学习策略属于推理学习策略，将“一般到个别”的推理方法当作基础。对于所给出的知识予以演绎和推理，并且得出全新结论，而后需要存储正确并且具有一定价值的结论。如果把演绎推理过程反逆，就被称为归纳推理[2]。　　2.4 归纳学习　　所谓的归纳学习，指的就是由环境所提供的概念或反例，使其在归纳中推理概念。它的推理量比示教学习与演绎学习推理量大很多。归纳学习包括示例学习与观察学习。其中，示例学习就是为机器的学习系统提供示例，进而使其在归纳中获得概念一般描述。而观察学习则是学习系统观察环境并进行学习。　　2.5 类比学习　　类比推理是类比学习策略的重要基础条件，通过对事物相似性的充分利用来学习新的知识。具体的过程可以概括成：事先搜索与其相似并且实际存在的事物，而后和类似并且实际存在的事物予以合理变换和调整，最终获取全新事物，并将其纳入到知识库当中。　　3 软件安全中结合语义的机器学习方法　　在软件安全中，结合语义的机器学习方法指的就是同语义相互融合，进而保证软件系统整体多维特性的有效提升，进而迷惑恶意代码。结合语义机器学习方法属于检测算法，能够对被恶意代码或者是木马篡改的恶意文件进行严格地检测。该方法在检测的过程中，很容易识别迷惑恶意代码，而且，准确程度也很高。该学习方法通过使用语言的操作语义，对系统程序具体的执行行为进行确定。其中，操作语义同样可以当作语言解释器，并且每一条规则在读取的过程中，都是由左向右，由上向下[3]。另外，还应该把每条既定语句合理地匹配至相应的规则中。其中，在语义解释方面，语言模型可以分成两种：　　第一，面向用户的语言模型。这里所阐述的语言模型，主要是依据用户自身特点所提出的，所以，一定要与用户记忆特点相适应，其中一部分就是利用大规模训练的一种通用语言模型，该模型的参数是不会发生变化的；另外一部分就是在线学习用户模型，该模型的参数始终处于变化当中。然而，在实际使用的过程中，需要保证以上两种模型同时被应用。以汉语为例进行分析，第一种语言模型机器学习的过程可以解释成：首先把拼音或者是语句以键盘输入的形式传递到学习系统当中，而后使用通用语言模型与用户语言模型，同时对语言解码。再次，对输入内容进行转换，并且得到结果并输入至软件当中。如果最终的结果存在错误，那么就需要用户及时修正，最终将正确的结果内容输入到软件当中。最后一步就是通过机器学习或者是用户编辑反馈到以上两种语言模型当中。　　将以上两种语言模型进行结合的方式有很多，最具代表性的就是使用线性插值的方式，把通用语料以及用户输入的信息构建成两种相互独立的语言模型，并实现有机结合。其中，该模型的方式必须要始终