- 5
- 0
- 约1.48万字
- 约 29页
- 2018-03-10 发布于天津
- 举报
统一度量表示和基于典型相关分析的迁移学习在异构跨公司-Oscar
基于最大信息系数和凝聚层次聚类的
特征选择方法在软件缺陷预测中的应用
软件工程国家重点实验室
徐洲
contents
研究背景
基础知识
方法框架
结果分析
总结展望
contents
研究背景
基础知识
方法框架
结果分析
总结展望
背景介绍
版本控制系统、缺陷追踪系统等工具在软件开发过程中的普及,使我
们可以获得大量的软件缺陷相关数据。如何有效分析这些丰富的数据
,构建缺陷预测模型,来提高软件质量,合理分配测试资源,已成为
软件质量保证的研究热点。
2 ... 9 2 ... Y
输入 2 ... ?
新的模块
抽取模 8 ... 0 8 ... N
训练
块特征
人工标记
预测
5 ... 6 5 ... Y
?= Y 或者 ?= N
包含特征和类 预处理 训练数据集 预测模型
别标签的模块
虽然已有的研究提出了很多缺陷预测的模型,但是软件缺陷数据集中
存在的不相关和冗余特征会在一定程度的影响这些预测模型的性能。
而且过多的特征会增加模型训练时间和复杂度。
特征选择方法通过评价特征对分类模型的贡献,可以过滤掉数据集中
存在的不相关和冗余特征,得到一个精简的特征子集,能够有效解决
以上问题。
现有方法的不足:
现有的软件缺陷预测中的特征选择方法大多数关注的是如何寻找与类
标签相关性高的特征,很少考虑特征之间的冗余性。
软件缺陷特征与类标签之间往往存在很复杂的关系。
Liu et al.[1] 和 Chen[2]分别提出了一种基于特征排序和特征聚类的特
征选择方法来过滤掉不相关和冗余特征,但是他们在对特征进行聚类
之前要事先人为指定聚类的个数。
[1] S. Liu, X. Chen, W. Liu, et al. FECAR: A Feature Selection Framework for Software Defect Prediction 2014 IEEE
38th Annual Computer Software and Applications Conference (COMPSAC). IEEE Computer Society, 426-435, 2014.
[2] J. Chen, S. Liu, W. Liu, et al. A Two-Stage Data Preprocessing Approach for Software Defect prediction. Software
Security and Reliability (SERE), 2014 Eighth International Conference on.
您可能关注的文档
- 深圳汇顶科技股份有限公司2016年年报告.PDF
- 深圳福田中心区CBD规划建设经验教训及规划评价Shenzhen.PDF
- 深度学习在携程攻略社区的应用-李健-携程技术中心.PDF
- 混合云存储中海洋大数据迁移算法的研究-计算机研究与发展.PDF
- 清华大学2016年毕业生就业质量报告-清华大学学生职业发展指导中心.PDF
- 温德青室内乐泼墨Ⅰ的音响观念及其结构途径-WenDeqing.PDF
- 温度和振动对光纤马赫曾德干涉仪的影响与动态补偿-电子科学技术.PDF
- 港人内地读书就业身份待遇问题研究十大政策-一国两制青年论坛.PDF
- 湖北经济学院会计硕士专业学位MPAcc研究生培养方案-金融学院.PDF
- 湖南沅水五强溪水电站扩机工程公众参与说明书-五凌电力有限公司.PDF
最近下载
- 2025年长沙民政职业技术学院单招职业适应性测试题库(历年真题).docx VIP
- 湖南中考2025年语文试卷.doc VIP
- 劳动争议预防培训.pptx VIP
- 湖南衡阳中考语文试卷及答案.doc VIP
- 一锅法化学合成阿奇霉素的方法.pdf VIP
- 基层干部关于不忘初心牢记使命主题教育自我对照检查材料2500字【精选5篇】.docx VIP
- 高中生通过生物知识构建校园生态浮岛课题报告教学研究课题报告.docx
- 市场营销理论与实践 李继延.ppt VIP
- 飞秒激光:开启晶体折射率改性与功能波导结构制备新征程.docx VIP
- DGTJ08-701-2020 园林绿化工程施工质量验收标准.docx VIP
原创力文档

文档评论(0)