网站大量收购独家精品文档,联系QQ:2885784924

面向专题情报服务的英文科技文献深度加工与主题演化研究-情报学专业论文.docxVIP

面向专题情报服务的英文科技文献深度加工与主题演化研究-情报学专业论文.docx

  1. 1、本文档共186页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向专题情报服务的英文科技文献深度加工与主题演化研究-情报学专业论文

优秀毕业论文 精品参考文献资料 Master Master Dissertation Research Oil Deep Processing and Topic Evolution of English Scientific and Technical Literature for Selective Dissemination of lnformation By Wu Yang Supervised by Associate PYoj.Xue Chunxiang N删ing University of S cienceTechnology March,2016 万方数据 声 声 明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名: 至:三叠 加f 6年3月哆日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名: 塾三聿 加I 6年5月巧日 万方数据 硕士学位论文 硕士学位论文 面向专题情报服务的英文科技文献深度加工与主题演化研究 摘 要 科技信息与科学知识是科技进步与科技创新的关键性因素,数字化、网络化环境下 的科技文献资源具有海量化、多样化、数据增长迅速等特点,科学技术的飞速发展和人 们对最新科技文献的迫切需求导致了科技文献激增,尤以英文科技文献增长最为显著。 因此,如何从海量的英文科技文献中获取有用的知识,满足不同科研用户对专题情报研 究的需求,将是本文重点思考的问题。 本文以英文科技文献为研究对象,以数字化、网络化环境下的专题情报服务为需求 和出发点,以专题情报服务演变过程及趋势、文献资源存储与资源加工、主题分析与主 题演化、知识存储与知识管理的理论与方法为基础,充分融合关键词组提取、主题抽取 与主题演化等技术方法,探讨面向专题情报服务的英文科技文献深度加工与主题演化问 题,设计开发面向专题情报服务的英文科技文献深度加工与主题演化原型系统,提高科 技情报服务工作中专题领域知识的处理分析和服务利用效率。 本文的主要工作和研究成果主要体现在以下三个方面: (1)整合英文科技文献深度加工处理流程框架,从资源采集与导入、资源加工与 处理和资源知识服务三个方面分别介绍其体系架构,并以可应用性、可操作性为导向, 针对资源加工与处理中的关键词组提取问题,对现有算法和技术进行改造应用,将其整 合到英文科技文献处理全生命周期全流程框架中。基于N.Gram统计模型,以Snowball 分类器为基础,针对英文科技文献的特征,结合TF.IDF、单词频率、单词个数、大写 字母个数和位置等特征,提出一种改进的细粒度、多层次的英文科技文献关键词词组提 取算法,充分考虑关键词“词组”提取问题,提高英文科技文献关键词词组提取的正确 率与召回率。对Engineering Village中采集的233篇火炮领域英文期刊论文进行实验, 结果显示本文提出的算法在关键词组提取的召回率达到61.10%,是目前通用的KEA算 法的近三倍,Fl值也高于传统KEA算法。 (2)提出基于关键词组提取和主题模型的多维度、可视化的英文科技文献主题演 化分析体系,包括体系结构、主题强度度量和主题演化判定的方法。从时间轴、关键词 词频等外部特征选取参数,多维度、多视角地基于特征统计进行主题分析,同时以英文 科技文献中主题的建模为切入点,以科技期刊和科技新闻为文献类型进行主题分析,构 建“文献一特征词一主题”的内容主题模型。最后选取火炮领域的英文科技期刊和英文 科技新闻进行实例分析,并对不同类型的英文科技文献进行主题分析与演化规律的对比, 观察其主题内容和在时间序列上的演化脉络及演化规律,发现不同文献类型的英文科技 文献其时间差异及词汇差异。 (3)从技术角度出发,采用Cjfj}程序设计语言和.NET开发平台,设计并开发了面 万方数据 摘要 摘要

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档