学术文献抄袭检测研究进展.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
学术文献抄袭检测研究进展.PDF

第57卷 第8期 2013年4月 学术文献抄袭检测研究进展 ■ 王晓笛 王效岳 白如江 [摘 要]指出近年来,学术抄袭事件时有发生,科研诚信引起全社会的广泛关注。随着信息技术的发展, 对于学术抄袭的的检验问题已不再停留在传统的“防止复制”阶段。总结整理目前国内外主要抄袭检验的研究 内容和研究方法,重点对基于统计的方法和基于数字指纹的方法进行总结,归纳目前抄袭检验技术应用的主要 数学算法和各自特点。通过对国内外研究成果的梳理,指出抄袭检验技术存在的不足及未来发展趋势和应用 领域。 [关键词]学术抄袭 抄袭检验 信息检索 [分类号]G350 [6] 1 引 言 数法的识别方法。N.Bulut 的统计结果证实了该方 法的可行性。然而,这些属性都无法体现局部特征,因   近年来,学术抄袭事件频出,国家相关部门也开始 此对于部分抄袭该方法无法检测,这也是属性计数法 高度重视学术抄袭问题。2007年1月16日,中国科协 的局限性。 发布《科技工作者科学道德规范(试行)》,提到“旗帜   与之相对,自然语言的抄袭形式多样,往往伴随着 鲜明地抵制败坏学术风气的行为。摒弃心浮气躁、急 语序的调整、同义词的替换、标点符号的更改等。直到 功近利的学风,坚决反对投机取巧、弄虚作假和抄袭剽 1991年,才出现了 自然语言文本抄袭识别软件 窃等丑恶行为”。2011年9月,中国科协、教育部联合 [7] WordCheck ,该软件由Richard采用关键词匹配算法 下发《关于开展科学道德和学风建设宣讲教育活动的 开发,开启了自然语言文本抄袭识别的序幕,本文讨论 通知》。为杜绝学术抄袭行为,营造一个良好的学术环 的学术抄袭检测即属于自然语言抄袭检测。 境,学术文献抄袭检测成为研究热点。当前的抄袭检 测技术主要从两个方面解决此问题:一是“防止复制 2 抄袭检测 (copyprevention)”;二是“复制检测(copydetection)”。 2.1 学术文献抄袭定义 “防止复制”不考虑检测问题,包括信息物理隔离法、 [8] [9]   按照N.Heintze 和吴育娇等 的观点,常见的抄 文件授权保护法[1] [2] 、文件封装法 等。随着网络的发 袭现象包括: 完全抄袭文献; 经过细微修改的文 ① ② [3] 展,这些方法目前已逐渐失去了优势 ,本文主要讨论 献; 经过重新组织结构的文献; 经过校订的新版本 ③ ④ “复制检测法”。 文献; 某文献的扩展版本文献; 包含其他文献中部 ⑤ ⑥   复制检测是针对数字文档的检测,主要分为自然 分内容的文献,部分内容被修改。除此之外,若两篇文 语言文本(如小说、论文)和形式语言文本(如数据文 献的主题和内容类似,则这两篇文献的

文档评论(0)

xiaoxiaoxin + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档