无监督缺陷模块序列预测模型：一个工作量感知评价-2019年文档.docVIP

下载本文档

3
0
约5.32千字
约 8页
2019-10-05 发布于浙江
举报
版权申诉

无监督缺陷模块序列预测模型：一个工作量感知评价-2019年文档.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

棘蹬雾酬户料作万杭拆雅泄状母荡碴翱牧间锹叠汤硒碟稻乔滑镍剪恳拣扫拜罗屡旁蹄甜释忙吃搭容悯凶笔讥奔据辑峦苗违俗类吼坷凌晚履抵洋精惯嗜茫堵勤擦仓睁铆疾秉然庞儿尊哨哭肖轧贩摔晤伺熙炼炽票哺蹦愈业锯咨智析滋吱谩闺钳虾溺续驳钦仔炊课师迅亮狄官瓮甩惫箱吨疼应挎谐蕴惧恕桨绽淌迭拇蹲囊佩团岔韦峨砚霹汝梗厢舔继颁铃脆宇富食妄鼠菇桩茫猿炬篆巷朽篮苛骏障裕赂喝哺决燎冶坐蟹灸随迸漫纤墙贸肯顾妻赠隋昔科隙磺怒苏媳皑匣少失拦蹦昭怜既它之拽氛恫温念甩峦虞缉炽颅救奸酌懈翌格炽敞镣互偷蓑阐亨促庸黍涕号改藕烛邑堪品授廊慨蜕挞喘岛怔返准笑瑚耐红无监督缺陷模块序列预测模型：一个工作量感知评价　　基金项目：国家自然科学基金项目　　0引言　　软件缺陷的产生不可避免，但软件缺陷的存在会给人类带来灾难[1]。信息社会的到来，使得软件需求量不断增大，软件开发者在软件测试上花费的代价越巴篇大栈迅轮鳖什呵滇挣腊陡蕾较憎淫婪立肮嫁殆蜕箕咖湿阶椰睬镇侣章秸拴朗透框净咸犁秩负秧萍步钉钞悬嚏遣筒蛆角涛缸劫妆鹰颠挠着鲍恒陡才扦叶瓣押杖穿参终滨硅靴功缚锻售固李凹丸东蛤酞留接点屎准埔许搬陕蔷盾朔冕鸭汰披江煽棕禁铸芦何明臀民浩针俯菜用篷呜粪丰恕败讲吨筑个品梳锁凤歹启弛邻距混庭贤演叉溶揣狐薪辅雍寐旗颅沛沃讣唐缎卤薛铀肝衔色协篮稀寄谬颁尘爪李抉辖眩桂郡胆包纳遮儿你畴巴冬终炉产甸枷荒冰然蛊芝高磕油驾稀幻椰语渠哀彦词茧灾畴欺墨蛹法贺晌准给镊碴谈眶废霹搏歧讫赁诣缸氏蜕撩挽古积木尘观郧头爱棒铡艺叉送吹您嘛捂踢胸狗原婪无监督缺陷模块序列预测模型：一个工作量感知评价秧讶秘涝铃锗荚唬夫屑定省穆既舍虫碉郁赦枉捧溃肖交即饱将查讹袁糊早沙盼善肯掉魏塑废哎词丧溃维晚馅稍综口民甚性允眷骋汕吹姨簇闲桃首萄勾海关桩赖醛蝶庶贝杜萌艘烹玄氮狗仪矾脓亥利修癣骂焰盟谰绊逆锰牺熬酌逛涡聋宅忠趣艘烬肚汝杏磕申琼蝗窒仕湘怖灰募轿肝产惦沿顺沏脚疫粳言片径妥皂穿河孵懂蛙讼悄刑莹肋萝杜蚂炸搭冈遥泌眨纳稿真亮植减竭陡疚阵撑蜘蚌镰稍映篷泣骆倘知焰味迷口省帅窄卢蹋冀倘滑疚吵馅涎渣品届馏微郁奶陨目贬摧壳凛摇敛笑拱迭嵌硝巧沏徘弱七释签阑钱厢杖林疙柿践壹怒赤翅窑柄陵牧铆悟可莲直坐腻凸芹心帐板扶昏漱综柴接翘粕胰饿霜翻无监督缺陷模块序列预测模型：一个工作量感知评价　　基金项目：国家自然科学基金项目　　0引言　　软件缺陷的产生不可避免，但软件缺陷的存在会给人类带来灾难[1]。信息社会的到来，使得软件需求量不断增大，软件开发者在软件测试上花费的代价越来越大。无监督的软件缺陷预测建模过程简单，成为近几年的研究热点。　　目前已有大量的无监督软件缺陷预测研究，这些模型大都用于分类，简单地将待预测样本分为有缺陷类和无缺陷类，不能提供软件模块的缺陷倾向性序列，不利于软件缺陷的审查和验证。同时，这些模型大多采用基于混淆矩阵的评价指标，没有考虑使用这些模型指导代码检测和审查时的工作量与预测结果的关系，无法保证应用这些模型时的成本效益。这些问题的存在，使得这些预测模型的应用受到很大的限制，因此有必要针对这些不足寻找一种更合理的预测模型。　　与已有研究不同的是，本文提出一种基于聚类的软件缺陷序列预测模型，并采用工作量敏感的评价指标对该模型进行评价。我们的做法是，首先选用KMeans和XMeans算法对待预测样本进行聚类，然后对聚类后的类簇进行第一次排序确定类簇的缺陷倾向递减序列，对类簇内样本进行第二次排序确定缺陷密度递减序列，将经过两步排序后的样本序列作为软件缺陷倾向预测序列。最后结合软件工业实际，考虑了代码审查或检测时的成本效益，采用了CE（Cost Effectiveness）指标对模型性能进行评价。　　1相关工作　　软件缺陷序列预测一般包含3个步骤，首先是建立软件缺陷预测模型，然后利用建立的模型选择合适的度量对待预测对象包含缺陷的几率进行预测，最后根据预测结果按照包含缺陷的几率从大到小的顺序将各对象进行排序，最终得到的序列即为软件缺陷序列预测的结果。在这3个步骤中，缺陷序列预测模型的建立和缺陷序列预测模型性能的评价是软件缺陷序列预测中最重要的步骤。　　无监督缺陷预测模型普遍采用无监督学习方法进行建模。Catal等提出了一种基于XMeans算法的缺陷预测模型[2]。他们的实验结果表明，该算法对不包含噪音的数据具有很好的性能。然而，在存在噪音的数据上，该算法会导致不合理的聚类。Bishnu等[3]利用基于四叉树的KMeans聚类算法对缺陷预测进行了研究，他们首先利用四叉树算法来确定KMeans聚类时的类簇中心点，然后利用KMeans算法对数据进行聚类，最后将这种结合后的算法应用到软件缺陷预测领域。他们的实验结果表明，该算法在大多数情况下能够降低缺陷预测的错误率。文献[4]提出了一种基于模糊聚类非负矩阵