面向软件仓库挖掘的数据驱动特征构建方法-软件工程专业论文.docxVIP

面向软件仓库挖掘的数据驱动特征构建方法-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生优秀毕业论文 大连理工大学硕士学位论文摘 大连理工大学硕士学位论文 摘 要 软件仓库挖掘是近几年软件工程研究中的重要领域。在软件仓库挖掘领域中,软件 工程任务通常转换成为数据挖掘问题。领域特征作为联系软件工程任务数据与数据挖掘 算法的关键内容,严重影响软件任务的解决效果。然而,如何根据特定任务从软件仓库 数据中构建有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。 本文通过问卷调查的形式总结已有的软件仓库挖掘领域的特征构建方法,并在此基 础上提出面向软件仓库挖掘的数据驱动特征构建方法,它是一种基于多名志愿者辅助的 全新数据驱动特征构建方法。对于给定的软件工程任务,该方法从任务的数据集中选取 部分数据(如源代码,缺陷报告等),同时招募若干志愿者依据这部分数据人工完成软 件工程任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素。研究者 通过分析这些因素,构建软件工程任务所需的领域特征。本文以软件仓库挖掘的典型任 务缺陷报告摘要为案例对该方法进行深入分析,实验结果表明,该方法能够高效的发现 领域特征,并提升数据挖掘算法在摘要任务上的预测效果。在此基础上,我们发现一系 列影响该方法性能的因素,如志愿者数量对该方法产生积极的影响,随着志愿者数量的 增加,该方法能够辅助研究者从多角度构建更丰富的特征。而领域知识并不是招募志愿 者的硬性要求,大量的无领域知识志愿者可以弥补缺少有领域知识志愿者的不足。最后 我们从内部效度和外部效度两个方面分析影响该方法有效性的因素,并逐一介绍解决方 法以及未来研究方向。 关键词:软件仓库挖掘;数据驱动方法;特征构建;缺陷报告摘要 万方数据 面向软件仓库挖掘的数据驱动特征构建方法Data 面向软件仓库挖掘的数据驱动特征构建方法 Data Driven Attribute Construction for Mining Software Repositories Abstract Mining Software Repositories(MSR)is an important field in software engineering in recent years.In MSR,software tasks are usually transformed into data mining problems for solving.Domain-specific attributes heavily impact the solving of software tasks,since they are the key part to connect software tasks and data mining algorithms.However,no systematic investigation has been conducted on the issue of constructing attributes for specific software tasks. In this study,we summarize attribute construction approach in MSR with a simple survey. Based on the results ofthe survey,we propose the Data Driven Attribute Construction(DDAC) approach for MSR.It is a new attribute construction approach witll the help of several volunteers.For a given software task,DDAC extracts a set of software data(e.g.,source code, bug reports,etc.)and employs some volunteers to manually accomplish this software task according to the software data.During the process,these volunteers are requested to submit their reasons under consideration.From these submitted reasons,researchers Can construct domain specific attributes for software tasks.nle experimental results on the typical MSR task of b

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档