网站大量收购独家精品文档,联系QQ:2885784924

代码摘要技术-徐程柯.pdf

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

BeijingForestStudio

ThenameoftheDepartment

北京理工大学信息系统及安全对抗实验中心

部门名称

代码摘要生成技术

硕士研究生徐程柯

2024年09月22日

内容提要

•预期收获

•内涵解析

•背景简介

•知识基础

•算法原理

–CoSS

–StructCodeSum

•特点总结与工作展望

•参考文献

2

预期收获

•预期收获

–掌握代码摘要的基本概念

–理解代码表示在代码摘要中的意义与作用

–理解代码摘要技术的基本原理

–了解代码摘要的应用领域和发展方向

3

内涵解析与研究目标代码摘要

•什么是代码摘要

–代码摘要(CodeSummarization),是自动为

目标代码生成富有信息性自然语言描述的技术

•研究目标

–面向涵盖多种编程语言和应用场景的代码库,

以及与代码相匹配的自然语言描述文档

–利用代码的语法和语义特征,结合自然语言处

理(NLP)、图网络等理论,捕获代码功能

–实现代码摘要的自动化生成,提高软件开发和

维护的效率

4

研究背景代码摘要

•研究背景

–软件工程的复杂性增加:随着软件系统的规模和复杂

性日益增加,理解和维护这些系统的难度也相应提高

–代码重用需求:在现代软件开发中,代码重用是提高

开发效率的关键因素之一,若缺乏足够的文档或者代

码描述,代码的重用率会大大降低

–自然语言处理技术的进步:大型预训练语言模型

(LargeLanguageModel,LLM)在大规模文本数据

上进行预训练,学会了捕捉和理解复杂的语义信息,

可以用于各类型下游任务中

5

研究意义代码摘要

•研究意义

–提高软件开发的效率和质量:自动生成的代码摘要可以帮助开发者更快地理解复

杂代码结构和业务逻辑,从而加速开发流程并减少因误解代码功能而引起的错误

–代码审查和质量控制:代码摘要可以在代码

审查过程中提供关键信息,帮助审查者快速

把握代码实现目标,从而提高审查的效率和

质量

–辅助自动文档生成:通过自动生成与代

码直接关联的摘要,可以确保文档的

实时更新和准确性,同时减轻开发者的

文档编写负担

6

研究历史代码摘要

Haiduc等人首次尝试使用信息检索Y.Wan等人引入抽象语法树T.Ahmed等人利用LLM来理解代

(IR)技术生成代码摘要,采用基于(AST),将源代码的结构表示为码功能,以零样本或通过上下文

规则和基于IR的启发式方法,从

文档评论(0)

说明书文档库 + 关注
实名认证
内容提供者

提供说明书查找服务。

1亿VIP精品文档

相关文档