统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar.PDFVIP

  • 5
  • 0
  • 约1.48万字
  • 约 29页
  • 2018-03-10 发布于天津
  • 举报

统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar.PDF

统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar

基于最大信息系数和凝聚层次聚类的 特征选择方法在软件缺陷预测中的应用 软件工程国家重点实验室 徐洲 contents 研究背景 基础知识 方法框架 结果分析 总结展望 contents 研究背景 基础知识 方法框架 结果分析 总结展望 背景介绍 版本控制系统、缺陷追踪系统等工具在软件开发过程中的普及,使我 们可以获得大量的软件缺陷相关数据。如何有效分析这些丰富的数据 ,构建缺陷预测模型,来提高软件质量,合理分配测试资源,已成为 软件质量保证的研究热点。 2 ... 9 2 ... Y 输入 2 ... ? 新的模块 抽取模 8 ... 0 8 ... N 训练 块特征 人工标记 预测 5 ... 6 5 ... Y ?= Y 或者 ?= N 包含特征和类 预处理 训练数据集 预测模型 别标签的模块 虽然已有的研究提出了很多缺陷预测的模型,但是软件缺陷数据集中 存在的不相关和冗余特征会在一定程度的影响这些预测模型的性能。 而且过多的特征会增加模型训练时间和复杂度。 特征选择方法通过评价特征对分类模型的贡献,可以过滤掉数据集中 存在的不相关和冗余特征,得到一个精简的特征子集,能够有效解决 以上问题。 现有方法的不足: 现有的软件缺陷预测中的特征选择方法大多数关注的是如何寻找与类 标签相关性高的特征,很少考虑特征之间的冗余性。 软件缺陷特征与类标签之间往往存在很复杂的关系。 Liu et al.[1] 和 Chen[2]分别提出了一种基于特征排序和特征聚类的特 征选择方法来过滤掉不相关和冗余特征,但是他们在对特征进行聚类 之前要事先人为指定聚类的个数。 [1] S. Liu, X. Chen, W. Liu, et al. FECAR: A Feature Selection Framework for Software Defect Prediction 2014 IEEE 38th Annual Computer Software and Applications Conference (COMPSAC). IEEE Computer Society, 426-435, 2014. [2] J. Chen, S. Liu, W. Liu, et al. A Two-Stage Data Preprocessing Approach for Software Defect prediction. Software Security and Reliability (SERE), 2014 Eighth International Conference on.

文档评论(0)

1亿VIP精品文档

相关文档