程序源代码剽窃检测串匹配算法的研究 - 计算机工程与科学.pdf

程序源代码剽窃检测串匹配算法的研究 - 计算机工程与科学.pdf

程序源代码剽窃检测串匹配算法的研究 - 计算机工程与科学

维普资讯 CN43-1258/TP 计算机工程与科学 2008年第 3O卷第3期 ISSN 1007—130X C0M UTERENGINEERING SCIENCE V01.30,No.3,2008 文章编号:1007-130X(2008)03-0062-03 程序源代码剽窃检测串匹配算法的研究 ResearchonaStringMatchingAlgorithm forDetectingPlagiarizedSourceCode 邓爱萍 ,徐国梁 ,肖 奔 DENG Ai—pin -一。XU Guo-liang2,XIAO BenI (1.湖南人文科技学院计算机科学技术系,湖南 娄底 417000;2.湖南大学计算机与通信学院,湖南 长沙410082) (1.DeparlmentofComputerScience,HunanInstituteofHumanities,ScienceandTechnology。Loudi417000; 2.SchoolofComputerandCommunications,HunanUniversity,Changsha410082,China) 摘 要:检测剽窃的源代码,在验证学生的作业中很重要。代码的相似度度量是剽窃检测的关键技术。首先本文介绍 了源代码剽窃检测技术在国内外的发展情况,然后提 出了一种改进的基于Karp-Rabin和GST算法的程序源代码相似度 测量方法。 Abstract:Detectingthesourcecodeplagiarism isimportanttOverifyingstudents’projectworks.Thecodesimilarity tisthekeytechnologyinthedetection.Inthispaper,wesurveytheprogressofthesourcecod eplagiarism de— tectiontechn ologyfirst.Thenweproposean improvedprogram codesimilaritymeasurementmethodbasedon theKarp- RabinandtheGST algorithm. 关键词:源代码;剽窃检测;相似度;Karp-Rabin算法 Keyw0rds:sourcecode;plagiarism detection;similarity;Karp-Rabinalgorithm 中图分类号:TP311.52 文献标识码:A 2.1 属性计数法 1 引言 Halstaed提出的软件科学度量方法是最早和最典型的 属性计数法l1]。在剽窃检测算法的发展过程中,大多数工 程序设计是高等学校计算机教育中必不可少的实践环 作集中在Halstead的这一软件科学理论。这些基于软件 节。为了保证实践教学的质量,就必须有一定的措施来对 科学度量的算法是从程序中提取出数个软件度量特征,并 源代码进行剽窃检测。现在通过比较代码优化后的目标代 使用这些特征来比较程序。程序特征的抽取要求扫描、搜 码检测已经非常有效。但是,对于计算机公共基础课和低 索一个保留字表,构造一个符号表,而且分析受限于编程语 年级

文档评论(0)

1亿VIP精品文档

相关文档