- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
软件工程数据挖掘技术.doc
软件工程数据挖掘技术
随着互联网技术的普及,电子技术发展速度不断加快,软件技术的也得到前所未有的发展,但传统的计算机软件维修维护变得更加困难。通过数据挖掘技术将软件中的数据提取出来,将有助后续软件技术的发展。所以软件数据挖掘技术的发展与探究有十分重大的现实意义。本文通过介绍软件数据挖掘技术,分析未来软件工程数据挖掘的发展方向,为后续的研究人员提供参考和借鉴。
【关键词】工程数据 挖掘 发展方向
1 引言
软件数据挖掘技术是在软件储存的大量数据中寻找所需信息的技术。软件数据挖掘技术是软件工程研发中数据搜索领域中一项重要研究方向。数据挖掘技术不仅可以有效缩短开发的周期,同时也能够增加软件的延伸性和稳定性。随着电子行业的快速发展,软件开发领域不断受到重视,其数据搜索技术将得到更加广阔的发展和重要应用。因此软件数据挖掘技术的发展不仅具有重要的学术研究价值,同时也具有十分重要的应用价值。本文主要介绍软件数据挖掘技术的研究现状、所遇到的发展问题及未来的发展方向。
2 软件数据挖掘技术
2.1 软件数据挖掘技术的发展背景
软件数据主要是在软件研发过程中,研究人员对软件的开发进行模拟,分析,对软件开发,升级进行操作性分析,其重要编码、代码等相关数据。这些重要的信息数据是研究人员获取软件开发信息的唯一来源。随着软件技术的发展和软件的升级更新,软件中其重要的研发编码和工程信息将出现指数性增长。例如:Kumia软件研发数据中,其编码超过600万行。随着软件的升级更新,这对研究者对软件价值数据开发的有很高要求。因此利用软件数据挖掘技术获取软件工程数据对研发人员开发和软件升级是十分重要的。
2.2 软件数据挖掘技术的过程
通常情况下,软件研发中工程数据的获取主要寻找未升级更新的原始数据,这些工程数据便于研究人员发现。这些数据信息来自不同形式的云数据中,来源途径不同,数据格式有差异,但较为容易转为同一格式。通过对软件挖掘数据过程中数据噪音、无序数据的筛选,可以对工程数据进行挖掘。近些年,主要的?稻菟阉鞔?理技术包括LDA、LSA。
工程数据挖掘这一技术是从软件数据信息中的海量数据中寻找出能够代表软件重要信息和基本规律的原始数据。导入的数据是规律有序的代码或文本,将相关、分支信息的形式表现出来,这些信息的表现形式与挖掘技术有重要联系。
评估论证信息。通过对搜索结果的评估确认出对开发者和使用者有价值的数据。其中包括将软件和工程信息等转化为使用者能够理解和方便使用的形式,并将评估结果提供给研发人员。
3 软件数据挖掘技术面临的问题
3.1 软件数据复杂化
目前软件工程所涉及的数据主要包括两类:结构化和非结构化。结构化数据中包含很多信息涉及软件类型和错误报告。而非结构化数据主要包含软件工程的编码、代码等。两类工程数据采用不同的算法和编撰程序,但是两者之间还有很多密切的联系。因此在软件工程数据挖掘过程中要深入了解两个工程数据的联系和结构不同,这对数据提取造成很多困难。
3.2 分析方法难道高
软件工程数据挖掘后期的主要工作是将获取的数据转换成用户能够接受的形式。在传统的数据提取技术过程中,如电子商务等需要将其转换成数字或图表等,但是这对软件开发者并不是件轻松的工作,其包含很多分析编程方法、错误报告的选取。这对软件数据挖掘技术发展存在一定挑战。
3.3 软件数据挖掘结果标准多样化
很多行业对软件工程数据挖掘都有一定应用。但是在表达和评估结构上,软件工程数据存在较多标准,且标准不唯一。这对软件开发者获取数据后处理将是极为复杂,同时不同标准需要数据表达的方式也不尽相同,若想获取准确的数据信息结果存在一定困难。
4 软件数据挖掘技术的解决方法
4.1 软件信息复杂化解决办法
数据复杂化解决办法主要有三种:
4.1.1 数据结构类型复杂化
目前研究人员通过对软件信息的结构图和结构网中获取信息。
4.1.2 数据间联系复杂化
这种类型数据可以通过软件数据升级,强化数据间的联系程度,进一步提高获取有用信息数据的准确性。
4.1.3 数据中存在大量错误报告和缺失数据
对于这种类型的报告可以采用半管理式分析方法降低错误或缺失数据带来的影响。
4.2 非传统数据的分析方法
对于文本或数据等软件数据,软件研发人员采用使用范例的形式进行分析,很多研究结果涉及软件使用案例和编程规则。同时将程序可视化,极大的满足了研究人员对非传统数据挖掘的要求。
4.3 挖掘数据评估结果解放办法
传统的数据评估方法很难使用不断变化的软件工程挖掘技术,研究人员通过利用缺陷检测的评估方法对提取数据进行评估,但是这种方便也
您可能关注的文档
最近下载
- 2024中国电信股份有限公司陕西分公司校园招聘试题及答案解析.docx
- (正式版)-B 5768.2-2022 道路交通标志和标线 第2部分:道路交通标志.docx VIP
- 有毒有害气体安全防护培训.pptx VIP
- 北师大版数学六年级上册数学好玩备课教案.docx VIP
- 20-丙型肝炎病毒实验活动风险评估报告.doc VIP
- 《AI时代如何做好班主任》---校长在班主任培训会上的讲话.doc VIP
- 在作风建设专题研讨会上的发言材料.docx VIP
- 数字智慧方案IDC工业企业数字化的两种路径(35页PPT).pptx VIP
- 【PPT课件】2024特种设备重大事故隐患判定准则培训资料.pptx
- CATIA高级应用-七大技巧-个人总结,图文.pdf VIP
文档评论(0)