程序相似性检测系统.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
福州大学 软件学院 软件工程 2007 级(3)班 220700319 蔡丹 莉 程序相似性检测系统 1. 问题提出 第 1 个程序,功能:程序相似性检测 入口参数(3 个):2 个待比较的程序名和 1 个存放比较结果的文件名 出口参数:程序相似度(0—100 之间的值) 数据结构,算法描述,异常条件及处理方法描述,编程者/版本/版权,编程开始/结束时间, 测试说明,其他需要说明的问题(参考文献、使用和移植限制)等。 第 2 个程序,功能:成批程序相似性检测 入口参数(3 个):1 个存放待比较的所有程序名的文件名,1 个存放相似度限制(1—100 之间 的值,只有超过该值的程序才记录),1 个存放比较结果的文件名 数据结构,算法描述,异常条件及处理方法描述,编程者/版本/版权,编程开始/结束时间, 测试说明,其他需要说明的问题(参考文献、使用和移植限制)等。 2. 目的和意义 在各程序设计教程中,由于计算机数据的易复制性,导致许多学生抄袭他人程序作业, 影响了成绩的公平性,然而使用传统人工方法检查作业抄袭不仅费时,且不准确,开发出 一种智能检测系统,能够快速、高效、准确的检查出相类似的程序代码,减少学生的程序 抄袭现象。 3. 软件功能描述 检测两个程序或多个程序代码之间的相似度 D(0-100),D 越大,相似程度越高,反之, D 越小,相似度越小,并根据相似度大小,将相似度(D70)的定为低度相似,将相似 度(80D≤90)的定为中度相似, 将相似度(90D≤100)的定为高度相似 函数(模块)和主要算法的描述 根据两个程序代码之间存在的相似性问题,采用属性计数与目标代码对比相结合的思想 实施相似性代码的检测,实现对输入程序代码相似度和评价结果的获取.同时运用最长公共子 序列(Longest Common Subsequence,LCS)算法来对比两个源程序文件在结构上的相似性。 采用面向对象的功能模快设计思想,在构建属性数据库的基础上,设计预处理模快,属性 检测模快,相似目标代码检测模快和相似度评价模快等五大功能模快 预处理模快:1.冗余处理模块(包括去掉预处理命令,去除标准输入输出毫不语句,去除注 释,去除程序中的空白字符和空行) 2.分词模块 属性检测模快: 物理属性 程序代码的总行数,物理容量,总的词数,总的字符数 Halstead 属性:总的字符数,唯一的标志符数,用户定义的标识符数,程序 的 Halstead 容量 相似目标代码检测模快:用最长公共子序列(Longest Common Subsequence,LCS)算法 相似度评价模快. 通过对五个模快的处理,实现了对程序相似性的检测 1 福州大学 软件学院 软件工程 2007 级(3)班 220700319 蔡丹 莉 主要算法是:最长公共子序列(Longest Common Subsequence,LCS)算法, 字符串哈希 函数(著名的 ELFhash 算法),权重系数的计算. 4. 数据结构 定义了一个文件流类 class Cppout(); 5. 其出说明(环境, 总结与体会等) 系统软件设计开发基于 Visual C++ 6.0 的开发平台 6. 总结与体会 通过课程设计培养了我的动手能力以及综合运用所学的 C++语言基础理论,基础知识, 基本技能,进行程序分析和程序开发,提高在实际开发中解决问题的能力,达到了能够利用 C++语言进行应用程序的规划,分析,设计和实施,更能进一步使我对这门语言有深刻的理 解和更好的得到巩固,更能对我所学的知识得到检验。 在本题中,因为没有提前去查找相关材料和时间的关系只写了程序的预处理模快(编译还 没通过),而且本题对我来说确实有一定的难度,,从中我认识到了自己与其他好的同学的差距, 今后我一定要经常编程,经常实践,只有更加努力才能让自己不断进步. 虽然只写了一小部分且还存在着错误,敬请老师指正! 7. 致谢 在这里,我要感谢老师一直以来对我们的耐心指导和讲解和那些在这次课程设计中给予 我热心助人的同学们。同学间的相互帮助,相互讨论更让我们有了一个良好的学习氛围, 促进了大家彼此之间的相互进步。 8. 参考文献 《C++程序课件》 王灿辉 《C++程序设计》 钱能 清华大学出版社 《C++程序设计试验指导》 钱能 清华大学出版社 《C 程序相似代码识别方法的研究与实现》  张鹏  硕士学士学位论文 《C++Primer》中文版 Stanley B.Lippman Josee Lajoie Barbara E.Mo 人民邮电出版 社 2 福州大学 软件学院 软件工程 2007 级(3)班 220700319 蔡丹 莉 9. 附录 程序清单 //自己写的预除理模块 #includeio

文档评论(0)

liushuixian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档