一种基于人工智能的软件代码缺陷识别方法及相关装置.pdf

一种基于人工智能的软件代码缺陷识别方法及相关装置.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111143219 A (43)申请公布日 2020.05.12 (21)申请号 201911380345.3 (22)申请日 2019.12.27 (71)申请人 中国信息安全测评中心 地址 100085 北京市海淀区上地西路8号院 1号楼 (72)发明人 辛伟 管志斌 王嘉捷 王晓萌  张利  (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 杨华 (51)Int.Cl. G06F 11/36(2006.01) 权利要求书2页 说明书9页 附图2页 (54)发明名称 一种基于人工智能的软件代码缺陷识别方 法及相关装置 (57)摘要 本申请提供了一种基于人工智能的软件代 码缺陷识别方法及相关装置,其中,方法包括:将 待检测软件代码拆分为具有依赖关系的多个软 件代码碎片;通过词向量算法,将每个软件代码 碎片转换为软件代码向量,以得到具有依赖关系 的多个软件代码向量;根据待检测软件代码对应 的多个软件代码向量,确定待检测软件代码是否 为缺陷软件代码。由于本申请在确定待检测软件 代码是否为缺陷软件代码时,充分考虑了软件代 码向量之间的依赖关系,从而识别待检测软件代 码是否为缺陷软件代码时准确性更高。 A 9 1 2 3 4 1 1 1 1 N C CN 111143219 A 权 利 要 求 书 1/2页 1.一种基于人工智能的软件代码缺陷识别方法,其特征在于,包括: 将待检测软件代码拆分为具有依赖关系的多个软件代码碎片; 通过词向量算法,将每个软件代码碎片转换为软件代码向量,以得到具有依赖关系的 多个所述软件代码向量; 根据所述待检测软件代码对应的多个所述软件代码向量,确定所述待检测软件代码是 否为缺陷软件代码。 2.根据权利要求1所述的基于人工智能的软件代码缺陷识别方法,其特征在于,还包 括: 在对所述待检测软件代码进行拆分前,通过模式匹配算法对所述待检测软件代码进行 处理,得到去除注释、空白行和错误字符的待检测软件代码。 3.根据权利要求2所述的基于人工智能的软件代码缺陷识别方法,其特征在于,所述将 所述待检测软件代码拆分为具有依赖关系的多个软件代码碎片,包括: 通过抽象语法树算法,将所述待检测软件代码拆分为具有结构依赖关系的多个软件代 码碎片; 和/或, 通过程序依赖图,将所述待检测软件代码拆分为具有语义依赖关系的多个软件代码碎 片。 4.根据权利要求1所述的基于人工智能的软件代码缺陷识别方法,其特征在于,所述软 件代码向量为数值形式。 5.根据权利要求4所述的基于人工智能的软件代码缺陷识别方法,其特征在于,所述根 据多个所述软件代码向量,确定所述待检测软件代码是否为缺陷软件代码,包括: 将多个所述软件代码向量输入预先建立的第一缺陷识别模型,获得所述第一缺陷识别 模型输出的第一缺陷判决结果,所述第一缺陷判决结果表明所述待检测软件代码是否为缺 陷软件代码; 其中,所述第一缺陷识别模型为以训练软件代码对应的多个训练软件代码向量为训练 样本,以标注的训练软件代码是否为缺陷软件代码的结果为样本标签训练得到。 6.根据权利要求4所述的基于人工智能的软件代码缺陷识别方法,其特征在于,所述根 据多个所述软件代码向量,确定所述待检测软件代码是否为缺陷软件代码,包括: 将每个所述软件代码向量输入预先建立的第二缺陷识别模型,获得所述第二缺陷识

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档