- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本人郑重声明:所呈交的学位论文是我个人在导师指导下进行的研究
工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表和撰写的研究成果,也不包含为获得华 东交通大学或其他教育机构的学位或证书所使用过的材料。与我 一 同工作 的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢
二泣晶
忠、。
日月制且f口
日月
制且f
口μ
本人完全了解华东交通大学有关保留、使用学位论文的规定,即:学 校有权保留送交论文的复印件,允许论文被查阅和借阅。学校可以公布论 文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。
~ι 、?._且‘在解密后遵字i除栩官女、人 -Ava
》
学生本人签名
校内导师签名
-b-5
摘要
摘要
I
I
面向科技项目申报文本相似性检测算法的研究与应用
摘要
随着国家对科学事业的大力支持,科技项目研究经费下拨力度也随之大大提升,为 了防止在申报过程中存在重复申报等问题导致国家科研经费浪费、科研事业停滞不前的 结果发生,本文将针对科技项目申报这一领域的文本相似性检测算法作为研究对象,分 别对中文词语、句子和文本相似度计算方法进行了深入研究,进而将本文的研究成果应 用于科技项目申报系统中。
本文对传统的词语、句子和文本相似度计算方法进行了剖析,如基于向量空间模型、 基于本体、汉明距离等方法,一方面需要构建一定规模的语料库和和训练集,且存在高 维矩阵稀疏问题;另一方面,在抽取文本特征向量时,并没有将上下文语义结构和语义 关系考虑其中。所以计算精确度并不是非常高。为了进一步提高计算精确度,本文提出 了两种新的计算方法,一种是基于《知网》改进的词语相似度计算方法,另一种是针对 文本计算方法,提出了结合文本主题网络构建和语义分析的计算方法。尽管这两种方法 都在计算复杂度上有了一定的提高,但相对其更高的精确度而言,消耗一定的硬件代价 来弥补计算速率上的不足,这还是值得的。本文最后基于以上两种方法,设计并实现一 个科技项目文本相似性检测系统,来检测科技项目申报文本相似性。针对科技项目申报 这一特定领域的文本相似性检测算法的研究,实际应用当中,减少了审核人员的工作成 本、提高了工作效率,同时文本检测结果更为客观科学准确,有较大实用价值。
关键词:科技项目,相似性,文本检测,知网,文本主题网络
Abst
Abstract
II
II
RESEARCH AND APPLICATION OF SCIENCE AND TECHNOLOGY PROJECT TEXT SIMILARITY DETECTION ALGORITHM
ABSTRACT
As our country has given strong support to the scientific enterprise, the research grant of finance support has been highly risen. In order to prevent the repeated project application or the behavior of plagiarizing that may lead to the waste of research grant or the standstill of the science and technology enterprise during the application process, the similarity detection algorithm aimed at the application of science and technology project is regarded as the research object, then the intensive study on the similarity calculation method of Chinese phrases, sentences and texts are made respectively. After that, the research result can be used in the application system of science and technology project.
The traditional similarity calculation method of phrases, sentences and texts are dissected, then the existing defect and the method that can be improved are found. S
您可能关注的文档
- 罗格列酮联合替米沙坦对帕金森病MPTP模型小鼠黑质多巴胺能神经元的保护作用-人体解剖与组织胚胎学专业毕业论文.docx
- 煤岩介质电磁波衰减特性的频率域研究安全技术及工程专业毕业论文.docx
- 螺栓固定结合面动力学建模与影响因素研究-机械电子工程专业毕业论文.docx
- 民航气象自动观测系统中央处理单元的设计与实现-软件工程专业毕业论文.docx
- 绵羊kisspeptin介导的GnRH基因表达调控机制的研究-动物遗传育种与繁殖专业毕业论文.docx
- 面向多学科虚拟实验平台的仿真任务流监控-计算机应用技术专业毕业论文.docx
- 脉冲移位PWM电流型半桥变换器研究-电气工程专业毕业论文.docx
- 考虑收缩徐变的混凝土结构施工期可靠性研究-防灾减灾专业毕业论文.docx
- 驴新型Cathelicidin的基因克隆 多肽鉴定和功能分析-动物学专业毕业论文.docx
- 抗肿瘤坏死因子-α单克隆抗体对大鼠脑缺血再灌注损伤的作用-神经病学专业毕业论文.docx
文档评论(0)