- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机软件工程数据挖掘及发展的趋势的研究
计算机软件工程数据挖掘及发展的趋势的研究
摘要:随着计算机技术的不断发展,软件工程的发展速度日益加快,众多功能更加全面、性能更加稳定的应用软件不断涌现,而软件工程高速发展的同时,数据挖掘技术在其中所突显出的作用也变得越来越重要。就目前来看,我国在软件工程研发方向日趋智能化和自动化,这也使软件对数据的挖掘有了更高的要求,只有大胆创新,引入更加先进的数据系统,使数据挖掘在软件工程中更具针对性,重视海量数据的整合与分析,才能使软件的工作效率得以持续提升。为此,本文便对计算机软件工程的数据挖掘及其发展趋势进行深入的研究。
关键词:计算机;软件工程;数据挖掘;发展趋势
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)14-0261-02
近些年来,计算机软件工程的迅猛发展,使各种各样的软件在各个领域中得以广泛应用,极大程度地促进了各个领域的发展。对于企业来说,从海量数据中挖掘出相应的价值信息,对于提高企业管理水平有着十分重要的意义,而软件的使用则为企业的管理工作带来了极大的便利,这也使数据挖掘技术的应用在软件工程中发挥着越来越重要的作用。众所周知,软件是通过各种算法来对海量数据中的价值数据进行提取与分析的,以此帮助企业来最大限度地对价值数据进行高效利用。而在软件开发工作中,数据的收集工作更是其核心工作,只有做好数据的收集及抽取工作,才能确保软件中的数据库构建变得更加科学、合理,进而使软件在各个领域中的作用得到最大程度的发挥。
1 计算机软件工程数据挖掘技术的发展历程
计算机技术与互联网技术的不断发展,使其越来越重视数据挖掘技术的应用,尤其是互联网的迅速普及,使越来越多的用户开始通过互联网来进行生产生活,进而使互联网中产生了海量的数据,时至今日,这些数据仍旧在以几何倍数的增长。因此,对于这些数据的挖掘与利用,已经成为企业乃至社会不断前进的动力源泉。在此形势下,人们对计算机软件工程的数据挖掘性能也提出了更高的要求,其需要确保软件能够更加有效的从海量数据中挖掘出所需的价值数据,并通过这些价值数据的高效利用,来达到不断进步的目的。就现阶段来分析,数据挖掘方式主要分为两种,一种是验证性分析方式,另一种则是发现性驱动方式,而且正处于由验证性分析方式向着发现性驱动方式进行转变的过程。对于数据挖掘的验证性分析方式来说,主要是根据用户的需求来对相关数据进行搜集,并对假设的成立性进行重复验证,不过,由于大量数据所造成的堆积,使这种验证性分析方式难以对数据进行合理的分类,更加难以对数据进行有效利用。而数据挖掘工作需要通过最优集合、分类树等多种关键技术的应用,才能使其在实践中找出更加高效的数据挖掘方法,才能使数据挖掘任务得以更加出色的完成。而软件开发则是以软件控制角度为切入点,明确工作量化指标,使用户能够在软件开发前期就能对产品在开发过程中可能产生的若干问题进行充分了解。现阶段,人们越来越青睐质量数据,不过系统功能和数据分析并不是完美无缺的,其同样有着诸多问题有待解决。因此,应将数据收集工作和软件开发工作置于同一水平之上,通过彼此之间的共同发展,以此结合其动态变化和静态表述,进而使数据质量的占比得以显著提高。
2 计算机软件工程数据挖掘中面临的难题
1)同一算法难以适用于所有类型的数据
在软件工程中的数据主要分为两个方面,分别是结构化数据和非结构化数据。其中,结构化数据主要包括了软件的版本信息等?T多内容,而非结构化数据则是指一些文档和代码等内容。在计算机软件工程中,对数据的分析工作并不存在较为明显的界线,这也使结构化数据和非结构化数据的分析与处理工作难以采用同一算法来进行,不过这两类数据之间是存在密切联系的。例如,在缺陷报告中就不仅存在结构化数据,同样还包含非结构化数据,这也使这两类数据在软件开发中起到相互补充的作用。
2)挖掘方法转换速度较慢
在计算机软件工程数据挖掘中,需要对大量的信息进行转化,这样才能使这些信息数据得以共享。现阶段,人们所采用的信息数据挖掘技术仍旧不能满足其在实际工作中的应用需要,这些数据挖掘技术仍旧停留在图标和文字等形式上。现实是衡量计算机软件开发水平的重要标准,仅仅采用单一化的统计结果,势必会对软件的数据分析效率造成严重影响。因此,要想使各种类型的软件得到完美的开发,就必须要重视计算机软件开发过程中的信息整合工作,将开发需求作为立足点,并建立相应的编程模板,这样才能使计算机软件的数据挖掘性能更高,对信息处理的能力也更加出色。
3)缺乏统一的软件工程评价体系
由于计算机软件工程人员长期以来受到传统工作理念及方式的影响,使其很难突破现有的数据挖掘技术来进行技术革新。对于传统的数据挖掘技术来说,其发展时间较长,并且具备较为成熟的
文档评论(0)