科技文档的分类与查重-管理科学与工程专业毕业论文.docxVIP

科技文档的分类与查重-管理科学与工程专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
内窑摘要 科技活动具有不阔的活动形式与内容,科技活动的目的也具有多样性.为了能够实现 科学的评价科技项目的科技、社会、经济价值,本文提出了对科技项目分类与查瘦的相关 模裂和处理方法. 本文采用基于关键词匹配的一种改进的最大匹配分词算法,在对科技文档分词得到的 词频统计结果的基础上,利用汉明码集模板构造了科技文梢的汉明码集.在领域划分模裂 的支持下,在基于汉明距离计算的文本相似度的基础上将科技义精划分到其相应的应用领 域.并基于历史科技文档的汉明码集,利用改进的误差反传算法对三层前馈人工神经网络 进行训练后可实现对科技文榜的自动聚类,为实现科技项目同类可比性提供了支持.同时, 为了实现一份科技文档的相似文档快速查找功能,本文将已有的科技文梢按照层次聚类法 构造成树形知识结构,可以极大的提高相似项目查找的速度和效率. 关键词s 最大匹配算法:汉 H月距离;文本相似度:人工神经网绵:读毅反传算法 Abstract 四e scientific and technological activity have different fOnn5 and ∞ntent,and the goal of scientific and 阳chnologiω1 activily al50 have diversily. ln order to evaluale 血e scientific,socia!, E∞Inoroic value of the scientific and lechnological dωuroen饵, the paper puts forward the roodel and method to c1assify the scientific and technological documents ,and find the repetition betwωn them. 响lC paper adapts the improved Maximal Match Algoríthm method of tcxt segmenlalion ,it is a kind of keywords matching segmentatíon mcthod. Thcn we can gel the word frequency statistical ínformation of thc scicnlific anù lcchnoloιical documcnls. Th巳 papcr us巳s appJicalion ficld Hamming code model to get Ihc documen ts Hamming code vectors,thcn it can compute the Similarity dcgrcc bascd on thc dislancc of Hamminιcodc ,and Ihen it can classify thc scicncc and technology doωments 10 different application fields. And this paper uses neural network of three layers to classify a11 scientific and t∞hnologica1 d翩翩nts. Then it can support the professors to eva1uate its value based on its type. ln order to improve its speed of finding siroilar scientific and technologi叫 dω:umen邸,也e system stores the dωuments Harnming veωrsin the fonn of tree,it is built 出rough Hierarchi ca1口ustering Algorithm. The efficiency and aωuracy have been proved greatl y. Key Words: Maxlmal Match A1gori伽m; Hamm1ng Dlstance; 11创t Similarity; ArtIficiaf Neural Networks; Error Back Propagatlon A1gorithm 独创性声明 本人声明所黑变的学位论文是本人在导师指导下进行的研究工作及取得 的研究成果。据我所知,除了文中特别加以标谊和致谢的地方外,论文中不 包含其他人巳经发表或撰写过的研究成果,也不包含为辄

您可能关注的文档

文档评论(0)

jianzhongdahong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档