统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar.PDFVIP

下载本文档

5
0
约1.48万字
约 29页
2018-03-10 发布于天津
举报

统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar.PDF

统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar

基于最大信息系数和凝聚层次聚类的特征选择方法在软件缺陷预测中的应用软件工程国家重点实验室徐洲 contents 研究背景基础知识方法框架结果分析总结展望 contents 研究背景基础知识方法框架结果分析总结展望背景介绍版本控制系统、缺陷追踪系统等工具在软件开发过程中的普及，使我们可以获得大量的软件缺陷相关数据。如何有效分析这些丰富的数据，构建缺陷预测模型，来提高软件质量，合理分配测试资源，已成为软件质量保证的研究热点。 2 ... 9 2 ... Y 输入 2 ... ？新的模块抽取模 8 ... 0 8 ... N 训练块特征人工标记预测 5 ... 6 5 ... Y ？= Y 或者？= N 包含特征和类预处理训练数据集预测模型别标签的模块虽然已有的研究提出了很多缺陷预测的模型，但是软件缺陷数据集中存在的不相关和冗余特征会在一定程度的影响这些预测模型的性能。而且过多的特征会增加模型训练时间和复杂度。特征选择方法通过评价特征对分类模型的贡献，可以过滤掉数据集中存在的不相关和冗余特征，得到一个精简的特征子集，能够有效解决以上问题。现有方法的不足：现有的软件缺陷预测中的特征选择方法大多数关注的是如何寻找与类标签相关性高的特征，很少考虑特征之间的冗余性。软件缺陷特征与类标签之间往往存在很复杂的关系。 Liu et al.[1] 和 Chen[2]分别提出了一种基于特征排序和特征聚类的特征选择方法来过滤掉不相关和冗余特征，但是他们在对特征进行聚类之前要事先人为指定聚类的个数。 [1] S. Liu, X. Chen, W. Liu, et al. FECAR: A Feature Selection Framework for Software Defect Prediction 2014 IEEE 38th Annual Computer Software and Applications Conference (COMPSAC). IEEE Computer Society, 426-435, 2014. [2] J. Chen, S. Liu, W. Liu, et al. A Two-Stage Data Preprocessing Approach for Software Defect prediction. Software Security and Reliability (SERE), 2014 Eighth International Conference on.

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar.PDFVIP