cnki知网检测系统详细使用说明.pdfVIP

  • 20
  • 0
  • 约1.12万字
  • 约 25页
  • 2020-04-29 发布于江苏
  • 举报
学位论文学术不端行为检测系统 研制介绍与使用方法 第一章 系统简介 1.1 系统概述 学位论文学术不端行为检测系统(简称“TMLC”)以《中国学术文献网络出版总库》为全文比对数据 库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户 自建比对库。其系统示意图如图 1 所示。 图 1 检测系统示意图 1.2 系统技术路线介绍 TMLC 采用 CNKI 自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率, 召回率较高,抗干扰性强等特征。 支持篇章、段落、句子各层级检测; 支持文献改写,多篇文献组合等各种文献变形检测; 支持研究生学位论文、图书专著等超长文献的学术不端检测。 CNKI 自适应多阶指纹技术原理如图2 所示: 图2 CNKI 自适应多阶指纹技术原理图 对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指 纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满 足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和 检全率的高要求。原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。 1.3 系统功能概述 系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。 ◆已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇 已发表文献进行实时检测,快速给出检测结果。 ◆论文检测:主要实现论文实时在线检测功能。 ◆问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。 ◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库, 该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户 无权使用。 1.4 系统目的 TMLC 的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文 提供技术服务。检测系统在对论文进行检测之后,生成检测报告,为判断论文性 质提供相关依据。 第二章 检测原理及方法 2.1 支撑技术 CNKI 拥有强大的技术研发队伍,目前已经拥有了具有国际或国内领先水准的全面的数字出版的相关技 术,包括资源采集技术,文本数据库加工技术,文本数据库技术, 数字资源版权保护技术, 知识挖掘技术, 自然语言处理技术、快速比对技术等。在海量的全文数据的基础上实现快速准确的检测,上述技术是基本 的保证。 2.2 支撑资源 TMLC 需要一个尽可能完备的全文数据比对资源库,而 CNKI 的《中国学术文献网络出版总库》则正好 满足这一要求。到目前为止,CNKI 拥有学术期刊 7000 余种,期刊全文文献 2480 万篇,期刊期数和文献收 录完整率都大于 99.9%,文献量居国际国内同类产品之首;出版 503 家硕士学位点的 72 万篇优秀硕士学位 论文,368 家博士学位点的 9.6 万篇博士学位论文;1286 家重要会议论文 106 万篇;515 家重要报纸 500 多万篇;1376 种重要年鉴 787 万篇;600 多种工具书 220 多万条;学术引文索引数据 600 多万条;这些出 版物做到平均日更新 20000 条记录;国家标准、专利、SPRINGER 数据库也集成到 CNKI 网络出版平台中; 另外,出版平台还集成整合出版了各类第三方数据库资源 1020 种。 在收录资源种类上,CNKI 在国内具有明显优势,收录了期刊、学位论文、会议论文、报纸、年鉴、工 具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源。在资源收录数量上,CNKI 明 显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊。在资源更新速度上,CNKI 产品 除了第三方合作的外文文献以外,其他资源都做到了日更新,单日更新数量大,这是推行产业化、标准化 运作的结果。 2.3 系统架构模式 2.3.1 系统架构图

文档评论(0)

1亿VIP精品文档

相关文档