- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在软件工程的应用探索.doc
数据挖掘技术在软件工程的应用探索
[摘 要]当前是信息化的大数据时代,人们每天都生活在大量的数据中,生活和工作中信息无处不在,但如何能够在海量信息中定位自己的需求信息是现代人关注的焦。数据挖掘技术很好的解决了这个问题,不仅能够实现信息的定位还能在短时间内完成,大大的缩短了处理数据的时间。本文就以数据挖掘技术为中心点,首先对其概念进行简单的阐述,之后在此基础上分析了软件工程中的应用,以期能为相关专业的技术人员提供一定的技术参考。
[关键词]数据挖掘技术;软件工程;应用
中图分类号:TP311.5 文献标识码:A 文章编号:1009-914X(2016)17-0267-01
1.数据挖掘技术概述
所谓数据挖掘,主要指的是在大量的数据信息中利用科学、有效的算法第一时间获取到有用信息的筛选过程。大量的信息存在于生产和生活领域,使得人们在处理事情是无从下手,这样大大降低了人们的工作效率,也浪费了工作人员宝贵的时间。而这一问题通过数据挖掘技术的使用得到了很好的解决。
1.1 数据挖掘技术所采用的方法
在具体的操作中,数据挖掘技术会通过很多方法来使任务得以完成。具体的方法有如下几种:
1.1.1 遗传算法的使用
所谓遗传算法,主要是指基于生物自然选择与遗传激励的随机搜索算法,也是数据挖掘技术常用的一种操作方法[1]。遗传算法的有点就在于表面上看似无联系的事物,却能在事物模型间建立相关的练习,实现事物之间共同发展,现在生物界越来越重视的遗传基因等的研究,所以这种方法很受人们的欢迎。
1.1.2 采用决策树方法
这种方法主要用于对信息的分类和整合,在遇到大量的信息的时候,能够在短时间内找出关键的信息,能够使信息分类的快速化和简单化,并且保证了信息分类的准确度,但是此方法的不足之处就在于具有较差的抗噪性能,不能全面的来表述较为复杂的概念。
1.1.3 采用统计分析法
往往会利用回归分析和主成分分析等方法来分析数据库字段之间的关系。在字段之间的关系包括相关关系,函数关系也是其中的一种,不同的是函数关系可以用公式来表示,而相关关系则不能通过公示来表示关系,系统分析法的使用为这种关系的分析提供了便利。
1.1.4 采用可视化技术
可视化技术是采用一些图表来对数据进行表现,便于对数据的理解,比如,使用简单图形来展示存在于数据库中的多个数据,使研究者看起来一目了然,使单调的数据形象化,更容易掌握数据的相关信息。
1.1.5 采用神经网络方法
它模拟人脑神经元结构,以 MP 模型和Hebb学习规则为基础,用神经网络连接的权值表示知识,其学习体现在神经网络权值的逐步计算上。前馈式网络、反馈式网络和自组织网络是常用的三种神经网络模型,分别用于预测、联想记忆和聚类等。
2.数据挖掘技术在软件工程中的应用
2.1关于程序代码及结构方面的挖掘
①克隆代码检测的方法。克隆代码主要指的是根据软件工程运行需求,对某一代码段进行复制、粘贴,若有特殊需求,也可以对部分代码进行适当更改,对于上述代码的检测主要是为了避免故障传播,对系统进行简要维护,以此来满足软件系统运行需求。目前,克隆代码检测的方法主要包括4种,即文本对比、标识符对比、度量和程序结构[2]。每一种检测方法都有其不同的检测流程和判断依据,需要结合实际情况选取最佳的检测方法。
②Aspect 挖掘。Aspect 挖掘就是我们常说的横切关注点挖掘,在软件工程系统中,Aspect 挖掘是系统改造成面向方面软件所必须要处理好的重要问题。在此项问题的处理中,可供采用的方法有很多,最具针对性的就是度量分析法和形式概念分析法。上述两种方法可以利用候选集的重构将横切点关注挖掘相关问题有效解决。实际上,数据挖掘技术还可以在很多方面产生不错的影响。
③代码检索。在软件开发方法学中提倡着复用这个重要的原则,近年来有一个软件复用这方面领域里的很重重要的议题,也就是关于在本地或者是面向 WEB 这些代码库中检索出符合现阶段项目的代码之类的议题,已经出现了几种比较有代代表性的方式,比如分类存储并检索、基于输入-输出映射的检索、基于构件形式化描述、基于代码相似性等等方法,这些方式主要会涉及到有关于聚类、分类、语义分析等等几种比较主要的技术。由于其Web的应用范围不断的扩大,也就不再单单只有文档在其中,还有许多犹如 Google Cod 以及 Mica 等等类型的代码搜索引擎也随着那些 Web 中的可供参考的代码而出现
2.2软件项目管理中数据挖掘技术的应用
数据挖掘技术在项目管理中的应用主要体现在两个方面,即对组织关系的挖掘和对版本控制信息的挖掘。由于软件项目管理是一个全面而又系统的工程,因此,
您可能关注的文档
最近下载
- 郑州市2025年高中毕业年级第三次质量预测语文试卷(含答案)原卷.pdf
- 部编版 高中语文必修一(高一上册)同步练习:3.9.1 念奴娇 赤壁怀古.docx VIP
- DB11T 643-2021 屋面保温隔热技术规程.docx VIP
- 2025年中国辐照加工行业市场现状分析及发展前景研判报告.docx
- 甲状腺疾病的常见类型和管理策略.pptx VIP
- SL∕T 824-2024 水利工程建设项目文件收集与归档规范.docx VIP
- 口腔科门诊治疗室工作规范.docx VIP
- 纸张性能对印刷品质量的影响.doc VIP
- 浅谈长输管道沉管下沟施工技术(建筑设计及理论范文).doc VIP
- ampullary壶腹腺癌NCCN2025最新指南.pdf VIP
原创力文档


文档评论(0)