天津科技大学大数据结构与算法课程设计报告材料-源程序地相似性.docVIP

  • 5
  • 0
  • 约9千字
  • 约 12页
  • 2019-01-31 发布于安徽
  • 举报

天津科技大学大数据结构与算法课程设计报告材料-源程序地相似性.doc

实用标准文案 精彩文档 数据结构与算法 课程设计报告 设计题目:源程序的相似性 专 业 计算机科学与技术 学 号 姓 名 傅开煤 2017 年 1 月 10 日 实用标准文案 精彩文档 源程序的相似性 一、问题描述 对于两个C++语言的源程序代码,用哈希表的方法分别统计两个程序中使用C++语言关键字的情况,并最终按定量的计算结果,得出两份程序的相似性。 二、需求分析 建立C++语言关键字的哈希表,统计在每个源程序中C++关键字出现的频度, 得到两个向量X1和X2,通过计算向量X1和X2的相对距离来判断两个源程序的相似性。 例如:? ? ? 关键字? ? ? ? Void? Int? For? Char? if? else? while? do? break? class 程序1关键字频度? ? 4? ? 3? ? ? 0? ? 4? ? 3? ? 0? ? 7? ? 0? ? 0? ? ? 2 程序2关键字频度? ? 4? ? 2? ? ? 0? ? 5? ? 4? ? 0? ? 5? ? 2? ? 0? ? ? 1 ? ? X1=[4,3,0,4,3,0,7,0,0,2] X2=[4,2,0,5,4,0,5,2,0

文档评论(0)

1亿VIP精品文档

相关文档