程序代码相似度检测技术的研究与实现.docVIP

  • 45
  • 0
  • 约4.46千字
  • 约 6页
  • 2017-10-25 发布于北京
  • 举报

程序代码相似度检测技术的研究与实现.doc

程序代码相似度检测技术的研究与实现   摘要:针对传统相似度算法应用在程序设计课程作业检测中精度较低这一问题,通过研究最长公共子序列等算法,发现其优缺点,在分析的基础上,结合结构度量技术和属性技术两种技术,提出一种性能较好的程序相似度计算方法。方法首先对源程序进行初步处理,将程序中的注释语句和空格删除,再次确定常用元素及常用结构,然后利用Lex统计、抽取程序元素;利用?_源代码ucc生成语法树,之后抽取相应的语法结构;最后生成特征向量,并计算代码相似度。实验结果表明该方法比最长公共子序列算法精度提高了10.6%。   关键词:属性计数法;结构度量技术 ;相似度度量   中图分类号: TP311 文献标志码: A 文章编号:1009-3044(2017)05-0039-02   Abstract: To solve the problem of the low precision of testing for similarity of program codes in traditional ways, this thesis proposes an improved technique to make such a test on the combination of technology of attribute counting and that of structu

文档评论(0)

1亿VIP精品文档

相关文档