- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相容关系粒计算型在文章比对中的应用研究
摘要
摘要
随着信息技术的飞速发展,特别是互联网的发展,网络上的资源日渐丰富,
获取信息也变得更加的方便和快捷,同时抄袭也变得更加的容易。使用文章比
对系统能够实现对论文的自动比对,能够高效、快捷的帮助检测人员查找出存
在抄袭嫌疑的文章。同时,在刊物审稿过程,实现文章比对能进~步提高编辑
部的审稿速度与质量。并且文章比对还可以辅助鉴别文章内容的版权归属等问
题。因此,对于文章比对的研究具有一定的实用价值和现实意义。
本文以粗糙集和粒计算理论为核心,研究中文文章比对的方法。首先,介
绍了粗糙集理论、粒计算理论等基本知识,尤其是基于相容关系粒计算模型理
论。讨论了粒计算的相关概念、中文分词技术、文本特征值提取,以及中文词
语相似度计算等关键问题;其次,研究了基于相容粒计算模型的文章比对方法
和设计了相应算法。给出文章相容粒、段落相容粒和粒空间信息表的定义,粒
空间信息表的构建方法。根据粒计算理论中相容粒之间的外延关系和复合关系
来计算文章相容粒之间和段落相容粒之间的相似度,并给出了示例说明。描述
了基于相容粒计算模型的文章比对流程和提出了相应的算法;再次,在真实数
据集下对所提出的算法进行不同方面的测试,并对测试结果进行的分析。测试
结果和分析评估表明所提出的基于相容粒计算模型的文章比对方法是有效的,
它基本能满足用户对相似性文章的查找需求。最后,对所研究的工作进行了总
结和展望。
将粗糙集和粒计算理论应用于文章比对中不仅扩展了理论在新领域的应
用,而且为实现文章比提供了新的技术。
关键词,粗糙集,粒计算,相容粒,文章比对
Abstract
ABSTRACT
Withthe ofinformation of
rapiddevelopment technology,thedevelopment
Interact sourceofInteractismuchmore then
specially,the plentydaybyday,and
it’Smuchmoreconvenientto same
obtain the timeit’Smucheasierto
information,at
from
others.Article isusedto articles
copysomething ComparingSystem compare
staffstosearchthe articles
automatically,andhelptesting questionableeffectively
and the of methodofarticle
rapidlyMeanwhile,inprocessediting,the comparing
canbeusedto the of and call
improve assisteditortO
editingspeedquality.Also,it
the of andSO ofthe
文档评论(0)