- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于VSM模型的文本相似度检查软件的设计与实现
本科毕业论文(设计)
(2013届)
基于VSM模型的文档相似度检查软件的 设计与实现
院 系 计算机科学与技术系
专 业 计算机科学与技术
姓 名
指导教师
职 称 助 教
基于VSM模型的文档相似度检查软件的设计与实现
摘 要
近年来,论文抄袭、学术打假日益成为学术界和媒体界关注的话题。尤其在现在的高校中,学生经常为了应付老师布置的作业而直接或间接的抄袭别人的劳动成果。长此下去,高校学生的诚信度将受到严重质疑,那么采取一种有效的方法遏制学生抄袭的现象,成为一个现实的需求。因此,文本相似度检测应运而生。
本次设计的基于VSM模型的文档相似度检查系统主要是进行一个理论的研究。系统适用于对学生提交的实验报告、电子档作业等进行检测,从而提高学生独立完成作业的积极性。本系统基于C#语言和数据库技术,采用著名的向量空间模型VSM方法,对文本分词、词频统计及相似度计算三大功能进行模块化的设计,条理清晰,实现了文档相似度的计算,对检测学生的抄袭行为有很大的实用价值。
关键词:论文抄袭 VSM模型 文档相似度 数据库技术
ABSTRACT
In recent years, the plagiarism, the academic crackdown is increasingly becoming a topic of concern in academia and the media industry. Especially in the universities, in order to meet the teacher assignments , the students often directly or indirectly plagiarize the labor of others. If this trend continues, the integrity of the college students will be seriously questioned.Then taking an effective way to curb the phenomenon of student plagiarism becomes a realistic demand. Therefore, the text similarity detection came into being.
This similarity examination system based on VSM model is mainly a theoretical research. It’s suitable for students to submit the testing lab reports and electronic archives work, etc, so as to boost the enthusiasm of the students to finish the homework independently. The system which using the famous method of VSM vector space model is based on c # language and database technology.The text participle , word frequency statistics and similarity calculation function carries on the modular design.This system implements the computing document similarity. It is of great value to detect student’s plagiarism.
Key words: Thesis plagiarism VSM model Document similarity Database technology
目 录
第1章 绪论 1
1.1课题背景 1
1.2课题研究意义 1
1.3开发语言 1
1.4设计任务 2
第2章 系统原理介绍 2
2.1系统原理概述 2
2.2系统相关知识点简介 3
2.3系统实现思想 6
第3章 系统架构设计 7
3.1系统需求分析 7
3.2系统功能概述 7
3.3系统性能要求 9
3.4功能模块设计 9
3.5数据库设计 10
第4章 系统实现 12
4.1系统运
您可能关注的文档
最近下载
- 湿热灭菌验证方案及报告.doc VIP
- TZS 0680—2025《医疗机构实验室生物安全管理组织架构规范》(水印版).pdf VIP
- 网络游戏对青少年情绪调节和自我效能感的作用.docx VIP
- YBT4001.1-2019 钢格栅板及配套件 第1部分:钢格栅板.pdf VIP
- 大数据技术与应用 课件 第二章 大数据采集.pptx
- LAQ-E-KS-23 掘进工安全作业指导书.doc VIP
- 连云港市主要小麦品种产量与主要品质性状的初步研 究参考.pdf VIP
- DB32_T 3697-2019既有建筑幕墙可靠性检验评估技术规程.docx VIP
- PW2330-2.0数据手册下载.pdf VIP
- 2025湖南铁道职业技术学院教师招聘考试真题汇总.docx VIP
文档评论(0)