- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
近年来,随着信息技术的高速发展,计算机软件已经被应用到社会的各行各
业中。然而,由于资源、时间和业务等因素的影响,开发者往往提交一些不规范
的代码,从而影响了软件中的代码质量。技术债务是指开发者为了满足短期需求
(如软件发布计划、预算等)而牺牲长期代码质量所导致的后果。为了帮助软件
开发者识别软件中的技术债务,研究者已经提出了许多自动或半自动方法。目前,
通过代码注释来检测技术债务是最流行的检测方法。但是,研究表明技术债务的
代码注释通常存在长度差异明显、占总注释的比例小和不同项目间描述风格差异
大等问题,从而导致已有方法的效果仍不理想。另外,已有研究仅仅聚焦在技术
债务的检测问题上。然而,在实际中,开发者需要对检测到的技术债务做进一步
分类,这是一个非常消耗时间的工作。本文针对以上问题展开研究,深入分析代
码注释中的技术债务实例,帮助开发者更高效地识别技术债务。本文的主要工作
包括如下两个方面:
(1)为了识别技术债务,本文提出了一种基于注意力机制和双向长短期记
忆网络的自承认技术债务检测方法。该方法首先对代码注释进行预处理,然后使
用GloVe模型训练词向量,最后利用双向长短期记忆网络和注意力机制学习注
释中的文本特征来构建分类器。在训练分类器时,本方法使用平衡交叉熵损失函
数解决样本不均衡问题,并且使用遗传算法为平衡交叉熵损失函数的平衡因子寻
找最优或近似最优值,从而提高模型的泛化能力。基于真实数据集的大量实验表
明,该方法的平均精度为81.75%、召回率为72.24%、F1值为75.86%,分别比
最佳对比方法高出8.52%、5.24%和6.64%。
(2)为了有效识别不同种类的技术债务,本文提出了一种基于XGBoost的
自承认技术债务多分类方法。该方法首先对代码注释进行预处理操作,其次使用
数据增强策略增加数据集中小类的样本数量,以解决类不均衡问题,然后利用特
征选择方法对代码注释进行特征选择处理,最后使用XGBoost构造分类器。基
于真实数据集上的大量实验表明,该方法在技术债务分类方面平均能达到
63.14%、56.37%和56.25%的宏平均精度、宏平均召回率和宏平均F1值,分别比
最佳对比方法高出12.29%、3.77%和6.46%。
关键词:自承认技术债务、深度学习、自然语言处理、长短期神经网络、XGBoost
ABSTRACT
Inrecentyears,withtherapiddevelopmentofinformationtechnology,computer
softwarehasbeenappliedtodifferentdomainsinsociety.However,duetothefactors
ofresource,deadlinesandbusiness,thecodeprovidedbydevelopersisnotalways
standard,whichaffectsthequalityofcode.Technicaldebtreferstotheconsequences
thatdevelopersseekshort-termgains(e.g.,softwarereleaseplan,budget,etc.)at
expenseoflong-termcodequality.Tohelpdevelopersidentifytechnicaldebtin
software,researchershaveproposedavarietyofautomaticorsemi-automaticmethods.
Atpresent,detectingtechnicaldebtbycodecommentsisthemostpopularmethod.
However,thereisstillroomforimprovementabouttheeffectivenessofthesemethods,
sinceself-admittedtechnicaldebtcomments
您可能关注的文档
- 基于深度学习的情绪识别研究.pdf
- 基于深度学习的乳腺DCE-MRI影像分解方法及其在分子分型中的应用研究.pdf
- 基于深度学习的射频电路建模优化.pdf
- 基于深度学习的声纹识别技术研究.pdf
- 具有外部反馈半导体激光器混沌通信的数值研究.pdf
- 卷积神经网络的FPGA算法加速研究与实现.pdf
- 开关磁阻电机脉动转矩抑制方法的研究.pdf
- 考虑工作胜任度的人机协同任务分配模型与人机协作策略研究.pdf
- 考虑可再生能源不确定性的储能选址定容规划方法研究.pdf
- 可编程电源管理芯片数字部分设计和验证.pdf
- 美尼尔氏综合症护理查房.pptx
- 云南交通运输职业学院《金融市场的多米诺骨牌效应》2023-2024学年第一学期期末试卷.doc
- 东北石油大学《工程合同管理与招投标》2023-2024学年第二学期期末试卷.doc
- 长春大学《中药药理学实验》2023-2024学年第一学期期末试卷.doc
- 信息技术与学科融合(1).pptx
- 2025届贵州省兴仁县黔龙学校初三下学期期中联考化学试题含解析.doc
- 2024-2025学年广西防城岗市防城区达标名校初三语文试题5月模拟试题含解析.doc
- 福建省福州市八县一中联考2024届高三六校第一次联考英语试卷含解析.doc
- 抚顺师范高等专科学校《生物数据处理》2023-2024学年第一学期期末试卷.doc
- 浙江省杭州市翠苑中学2024-2025学年下学期初三数学试题5月月考试卷含解析.doc
最近下载
- 2025年2月党支部“三会一课”会议记录模板(详版).docx VIP
- ISO 9001(DIS)-2026《质量管理体系——要求》(含附录使用指南-中文版-雷泽佳译-2025年9月10日).pdf VIP
- 番茄收获机的设计.doc VIP
- 2025小红书电商双11-大健康保健品行业运营指南.pptx VIP
- 培智六年级上册人教版生活语文第6课《勤劳的双手》4课时教案.doc VIP
- 我爱你中国F调正谱伴奏艺术歌曲.pdf VIP
- 3.2细胞器之间的分工合作 课件(共26张PPT) 人教版(2025)高中生物学必修1(含音频+视频).ppt VIP
- 抗病毒治疗(国家免费艾滋病抗病毒药物治疗手册(第5版)课件).pptx VIP
- 日常生活活动能力评定量表.docx VIP
- 2025年管理百年南昌大学章节答案和期末答案.docx VIP
原创力文档


文档评论(0)