- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文抄袭识别技术研究综述 - 数字图书馆论坛
论文抄袭识别技术研究综述
□ 苏建华 / 西南政法大学图书馆 重庆 400031
摘要:复制检测技术在知识产权保护和信息检索中有着重要应用。文档复制检测在初期主要检测程序复
制,现在则主要为文本复制检测。文章首先介绍复制检测技术的发展中文,接着详细分析了目前已知各种文
本复制检测系统的检测方法和技术特点,最后指出了中文文本复制检测技术的发展方向。
关键词:文档复制检测,抄袭检测,信息检索
DLFDLF
用 应 与 术 技 抄袭论文识别技术属于复制检测 (c o p y 方法主要有基于数字指纹的方法、基于字符串比较
detection )技术中的一种,复制检测也称剽窃检测 的方法、基于V SM 的方法、基于语义序列模式的
(plagiarism detection ),就是判断一篇文档是否抄 方法和基于写作风格的方法等。典型的原型试验系
袭了其他文档的内容,是实施知识产权保护的一种 统有COPS[3] 、SCAM[4] 、CHECK[5] 、PPChecker[6] 、
T
重要手段。文档间的抄袭不仅意味着原样复制,还 WCopyfind (http :/// )、
e [7] [8]
c 包括词语句子级别的增加、删除、顺序调整和同义 MDR 、CD SDG 等。这些研究分别代表了不同
h
n
o
改写。该研究是建立在对数字文档及文本的分析处 的技术实现方法,COPS采用的是数字指纹方法,
l
o
g
理基础上的。数字文档可分为自然语言文本 (比如 CHECK是基于VSM 的方法,PPChecker是基于语义
y
小说、论文等)和形式语言文本 (例如数据文件、 序列模式的方法,WCopyfind是基于字符串比较实现
a
n
d
计算机程序代码等)。形式语言文本具有严格的形 的一个项目。目前国内关于中文文档复制检测的研
A 式化语法、清晰的语义表达,容易分析处理,所 究也越来越多,西安交大的鲍军鹏、大连理工大学
p
p 以形式化语言文本的抄袭识别研究较早,从1976年 的史彦军、金博等人发表了一系列相关文献并构建
l
i
c
a Ottenstein提出属性计数法 (attribute counting )检测 了相关试验系统,宋擒豹提出了数字商品非法复制
t
i
o 和防止程序抄袭后,就出现了很多形式化文本抄袭 的检测算法,但是关于建立在超大规模数据集上的
n
识别系统,并取得较好效果。而学术论文作为自然 中文文档复制检测系统还没有相关研究。
语言文本,没有形式化语法约束,语义具有歧义
您可能关注的文档
最近下载
- 深入贯彻2025年中央八项规定精神学习教育测试试题【含答案】.docx VIP
- 《财务会计学模拟实验教程》账薄答案汇总 1总分类账 --5多栏式明细账.docx VIP
- 2025年甘肃亚盛实业股份有限公司校园招聘模拟试题附带答案详解及参考答案.docx VIP
- 神经干细胞与神经系统疾病.ppt
- GCP质量控制培训课件.pptx VIP
- 锌合金转轴行业发展基本情况.docx VIP
- 家长进课堂—小学生建筑知识课件002230.pptx VIP
- 2025年深入贯彻中央八项规定精神学习教育知识竞赛试题及答案.docx VIP
- Power Up1精品教学课件U4 story.pptx VIP
- 2021年工会经审知识竞赛培训试题及答案.pdf VIP
文档评论(0)