网站大量收购独家精品文档,联系QQ:2885784924

论文抄袭识别技术研究综述 - 数字图书馆论坛.pdf

论文抄袭识别技术研究综述 - 数字图书馆论坛.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文抄袭识别技术研究综述 - 数字图书馆论坛

论文抄袭识别技术研究综述 □ 苏建华 / 西南政法大学图书馆 重庆 400031 摘要:复制检测技术在知识产权保护和信息检索中有着重要应用。文档复制检测在初期主要检测程序复 制,现在则主要为文本复制检测。文章首先介绍复制检测技术的发展中文,接着详细分析了目前已知各种文 本复制检测系统的检测方法和技术特点,最后指出了中文文本复制检测技术的发展方向。 关键词:文档复制检测,抄袭检测,信息检索 DLFDLF 用 应 与 术 技 抄袭论文识别技术属于复制检测 (c o p y 方法主要有基于数字指纹的方法、基于字符串比较 detection )技术中的一种,复制检测也称剽窃检测 的方法、基于V SM 的方法、基于语义序列模式的 (plagiarism detection ),就是判断一篇文档是否抄 方法和基于写作风格的方法等。典型的原型试验系 袭了其他文档的内容,是实施知识产权保护的一种 统有COPS[3] 、SCAM[4] 、CHECK[5] 、PPChecker[6] 、 T 重要手段。文档间的抄袭不仅意味着原样复制,还 WCopyfind (http :/// )、 e [7] [8] c 包括词语句子级别的增加、删除、顺序调整和同义 MDR 、CD SDG 等。这些研究分别代表了不同 h n o 改写。该研究是建立在对数字文档及文本的分析处 的技术实现方法,COPS采用的是数字指纹方法, l o g 理基础上的。数字文档可分为自然语言文本 (比如 CHECK是基于VSM 的方法,PPChecker是基于语义 y 小说、论文等)和形式语言文本 (例如数据文件、 序列模式的方法,WCopyfind是基于字符串比较实现 a n d 计算机程序代码等)。形式语言文本具有严格的形 的一个项目。目前国内关于中文文档复制检测的研 A 式化语法、清晰的语义表达,容易分析处理,所 究也越来越多,西安交大的鲍军鹏、大连理工大学 p p 以形式化语言文本的抄袭识别研究较早,从1976年 的史彦军、金博等人发表了一系列相关文献并构建 l i c a Ottenstein提出属性计数法 (attribute counting )检测 了相关试验系统,宋擒豹提出了数字商品非法复制 t i o 和防止程序抄袭后,就出现了很多形式化文本抄袭 的检测算法,但是关于建立在超大规模数据集上的 n 识别系统,并取得较好效果。而学术论文作为自然 中文文档复制检测系统还没有相关研究。 语言文本,没有形式化语法约束,语义具有歧义

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档