- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
探讨数据挖掘技术在软件工程中的应用研究
探讨数据挖掘技术在软件工程中的应用研究
探讨数据挖掘技术在软件工程中的应用研究
数据挖掘技术随着的软件系统的快速增长,数据挖掘技术也发生着变化,促进了数据技术在软件工程方面的应用。数据技术在软件工程中采用应用分类、预测等技术,从各种资源中能发现它潜在的技术,用来提高开发的效率。由于软件规模的扩大,软件也更加的复杂,数据挖掘技术主要通过技术手段来将大量的数据提取出来,软件工程应用是找出有价值的数据,对系统故障进行寻找并且解决,对系统的漏洞进行了评估等等。
一、数据挖掘技术在软件工程中的应用过程
数据挖掘技术被称作数据库中的知识,它发展的基础是数据库。在发展过程中,把理论的研究逐渐的转变为实际的应用,并将其与其他的领域共同结合,以更好地发挥其应有的作用。软件工程概念在1967年出现,主要通过了维护和构建,得出实用有效的软件,为客户开发出其所需求的产品。未来,数据挖掘技术在软件工程当中将发展越来越迅猛。
二、挖掘技术的概述
执行记录
主要对程序的路径做出了分析和总结,找出了程序中的关联关系。本质是跟踪执行路径,来实现它的目的,它的作用维护程序、了解程序。执行记录过程中,首先先分析系统,对软件的变量进行一系列的记录,最后过滤目标来得到信息,成为了系统功能的模板。
漏洞的检测
漏洞的检测是为了找出软件中存在的一系列问题,能最快时间的修复,确保了软件的可靠性。数据挖掘技术一般应用在漏洞检测方面,要对软件进行测试并且还要满足客户的需求,总结软件测试完后的具体内容,最终来决定用某种测试方式进行测试,来制定相应的计划;手机漏洞的数据,对数据进行清理,对采取的数据进行分析,采取有关的数据,把没用的数据清理完成后,在对丢失的项目进行补救,转换为数值表示。
还要选用适当的数据模型来进行训练和验证。选择挖掘方式,让它成为测试集,比较结果,找出结果最合理的方式。还要描述和分类软件的漏洞,把漏洞数据用到软件数据库,把相应位置的漏洞找出来,进行进一步的分类。
挖掘开源软件
开源软件的挖掘开放性等性质,所以对这种软件的开发,要和其他的软件区别开来。在正常情况下,开发软件,对参与报告等应用要有完整的记录。开发人员组成社会网络,因为它具有开放性,所以使开发的人员一直都在变化中进行。其次,还要对开源软件进行动态性挖掘,方便地管理了开源项目。
挖掘版本控制信息
主要保证了项目参与者和共同编辑的统一性,来更新全局。挖掘版本的应用方式,对变更信息挖掘找出不同模块,以及系统之间存在的关系。挖掘技术的应用可以把系统的维护成本降低,避免后期的变换产生的漏洞,最终起到了维护的作用。
三、应用方法
关联法
关联法的规则在于数据中的相关关联和有趣的关联。关联法还具有两个特征,第一个是支持度,第二个是置信度。
分类法
分类法是对分类标号进行一系列的操作,前提是先建立起相对应的模型,对数据集进行描述之后来完成分类。判定树法是主要的分类方法,包括了网络分类法和支持向量机法等等。贪心算法是判定树法的基础,如果是样本容量来进行分类的话,会导致出错。
聚类法
聚类法的应用是把数据分为多类,保证了数据的相似度,但是不同种类的对象有很明显的特征。划分法、基于密度法、模型法、网格法、层次法是聚类法的主要内容。
克隆代码数据挖掘
软件工程中,克隆代码的检查是原始数据挖掘的需求,现在则有很多的方式,主要分为:文本对比成为基础方式;标识符作为基础的方式。
第一类应用了计算机的对比程序对语句新型判断的过程,在改进中是对字符匹配效率提升,主要通过函数技术进行优化,所用的工具是Duploc。第二类是把标示符号用作最基础的方式,应用的工具有CCFiinder和DUP。
计算机软件数据检索
它和克隆代码是一样的,也是计算机最原始的挖掘,它的挖掘过程主要有三类:据信息录入、数据信息查找、数据信息内容查看。数据信息的录入是指对检索的信息进行录入而进行的过程;数据信息查找是指当客户需要查找数据时,把数据信息关键词输入到录入框,点击确定来进行对数据的查找。数据信息的查看是指客户可以根据自己所需要的对数据进行在线查看或者下载查看,在导出数据过程后,会形成历史记录,对客户查找的数据信息进行简单的保存。
四、结语
综上所述,现如今的发张趋势越来越快,软件工程技术已经应用到了各大行业当中,作为工程技术的重要技术,数本文由论文联盟http://www.LWlm.COM收集整理据挖掘技术也充分的发挥出了它相应的作用,充分的体现出了它自身的价值,但伴随着更多软件的发掘,数据技术已经不当当是单独作战了,与其他工程之间的融合,最终保障了工程技术的完整,未来的发展过程中,为
文档评论(0)