(毕业论文)基于VSM模型的文本相似度检查软件的设计与实现.doc

(毕业论文)基于VSM模型的文本相似度检查软件的设计与实现.doc

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本科毕业论文(设计) (2013届) 基于VSM模型的文档相似度检查软件的 设计与实现 院 系 计算机科学与技术系 专 业 计算机科学与技术 姓 名 指导教师 职 称 基于VSM模型的文档相似度检查软件的设计与实现 摘 要 近年来,论文抄袭、学术打假日益成为学术界和媒体界关注的话题。尤其在现在的高校中,学生经常为了应付老师布置的作业而直接或间接的抄袭别人的劳动成果。长此下去,高校学生的诚信度将受到严重质疑,那么采取一种有效的方法遏制学生抄袭的现象,成为一个现实的需求。因此,文本相似度检测应运而生。 本次设计的基于VSM模型的文档相似度检查系统主要是进行一个理论的研究。系统适用于对学生提交的实验报告、电子档作业等进行检测,从而提高学生独立完成作业的积极性。本系统基于C#语言和数据库技术,采用著名的向量空间模型VSM方法,对文本分词、词频统计及相似度计算三大功能进行模块化的设计,条理清晰,实现了文档相似度的计算,对检测学生的抄袭行为有很大的实用价值。 关键词:论文抄袭 VSM模型 文档相似度 数据库技术 ABSTRACT In recent years, the plagiarism, the academic crackdown is increasingly becoming a topic of concern in academia and the media industry. Especially in the universities, in order to meet the teacher assignments , the students often directly or indirectly plagiarize the labor of others. If this trend continues, the integrity of the college students will be seriously questioned.Then taking an effective way to curb the phenomenon of student plagiarism becomes a realistic demand. Therefore, the text similarity detection came into being. This similarity examination system based on VSM model is mainly a theoretical research. It抯 suitable for students to submit the testing lab reports and electronic archives work, etc, so as to boost the enthusiasm of the students to finish the homework independently. The system which using the famous method of VSM vector space model is based on c # language and database technology.The text participle , word frequency statistics and similarity calculation function carries on the modular design.This system implements the computing document similarity. It is of great value to detect student抯 plagiarism. Key words: Thesis plagiarism VSM model Document similarity Database technology 目 录 第1章 绪论 1 1.1课题背景 1 1.2课题研究意义 1 1.3开发语言 1 1.4设计任务 2 第2章 系统原理介绍 2 2.1系统原理概述 2 2.2系统相关知识点简介 3 2.3系统实现思想 6 第3章 系统架构设计 7 3.1系统需求分析 7 3.2系统功能概述 7 3.3系统性能要求 9 3.4功能模块设计 9 3.5数据库设计 10 第4章 系统实现 12 4.1系统运行

文档评论(0)

考试资料文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档