集成学习在软件缺陷检测中的运用-信息安全专业论文.docxVIP

  • 5
  • 0
  • 约4.91万字
  • 约 61页
  • 2019-05-03 发布于上海
  • 举报

集成学习在软件缺陷检测中的运用-信息安全专业论文.docx

南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。研究生签名: 日期: 南京邮电大学学位论文使用授权声明本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文 档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索; 可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质 论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。涉密学位论文在解密后适用本授权书。研究生签名: 导师签名: 日期: 摘要近年来,软件缺陷检测成为软件工程领域里的一个研究热点。其主要可分类动态检测与 静态检测两类。静态检测是使用软件的历史数据来建模预测软件缺陷,其具有较高的适用性 及准确性,被广泛地研究及运用。静态检测的关键是如何充分分析软件的历史数据,从而建 立准确的二分类模型来区分有缺陷软件与无缺陷软件。在软件缺陷检测中,有缺陷的软件样本会大大少于无缺陷的软件样本,这就造成了软件 缺陷的严重类不平衡问题,如何解决这个问题成为软件缺陷预测的关键。常见的方法有重采 样,代价敏感等。这里,我们使用基于下采样的 Bagging 方法,每次训练弱分类器时,采样 得到类平衡的样本子集。再通过多个弱分类器融合得到强分类器,从而提高模型的泛化能力 以及分类效果。集成学习的方法中,想要进一步提高模型的分类效果,我们可以从提高单一分类器的效 果,提高各个弱分类器的随机性,寻找合适的融合方法三个方面入手。之前我们通过下采样 方法,提高了单一分类器的分类效果。在此基础上,我们通过增加模型独立性,优化融合方 法等,进一步提高模型效果。在集成学习中,多个分类型之间越独立,最终得到的结果越好。对比于基于样本随机的 Bagging 方法,基于特征子空间的特征随机方法能够得到更加独立的弱分类器,从而取得更好 的模型稳定性以及分类准确性。在这里,我们引入基于特征构造的随机特征子空间方法,进 一步提高软件缺陷模型的分类效果。通过上述方法,我们得到一系列的弱分类器。由于二分类的特殊性,一般的准确率不能 很好地描述二分类模型的效果。这里,我们提出了基于综合评价指标 F-measure 的加权融合 方法,进一步优化模型效果。对于提出的所有方法,我们都在 NASA 提供的软件缺陷数据库上进行实验,与现今较流 行的一些方法进行比较。实验结果表明,我们的方法在 NASA 十个软件缺陷库上的分类效果 均有较大的提升。关键词:软件缺陷检测,改进 Bagging,特征构造,随机特征子空间,分类器融合IAbstractIn recent years, software defect prediction is one of the most important research topics in software engineering which can be generally categorized into two types: dynamic and static defect prediction. Static detection is to predict the software defect using software historical data, which has a high applicability and accuracy and has been extensively researched and used. The key for static defect prediction is how to make the analysis of software historical data in order to establish an accurate classification model to distinguish between defective software and defect-free software.For the software defect detection, the samples of defective software will be much less than defect-free software samples, which lead to the seriou

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档