我国电子信息领域地技术监测研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我国电子信息领域地技术监测研究

我国电子信息领域的技术监测研究-工程论文 我国电子信息领域的技术监测研究 杨虎 YANG Hu (甘肃工业职业技术学院,天水 741025) (Gansu Industry Polytechnic College,Tianshui 741025,China) 摘要: 本文通过对电子信息领域技术监测的概述,以信息文献中“主题”的建模为切入点,构建“文档-特征词-主题”三层拓扑结构的主题模型,并且设计并构建基于开源平台的科技监测原型系统。 Abstract: Through the overview of the technology monitoring in electronic information field, this paper takes the modeling of “theme” in information documentation as the pointcut to build the three layer topological structure theme model of “document - key word- theme” and design the monitoring prototype system of science and technology with the open source platform. 关键词 : 电子信息;技术监测;主题模型 Key words: electronic information;technology monitoring;topic model 中图分类号:TN015 文献标识码:A 文章编号:1006-4311(2015)06-0241-02 0 引言 电子信息产业对促进国民经济发展具有重要的作用,随着电子信息技术的不断发展,加强对电子信息领域的技术监测是对解决电子信息产业发展中的一些问题具有一定的指导意义,同时还可以为相关企业提供比较可靠的定量分析依据,因此研究电子信息领域的技术监测具有重要的意义。为更加清晰具体的分析电子信息领域的技术监测,本文选择科技信息监测技术为例进行分析。 1 技术监测的概述 1.1 技术监测的概念 技术监测是对过去、现在以及未来科学、技术、经济以及社会的系统研究,是以科学技术信息、数据为基础,通过电子信息技术手段,结合相关智力方方面的专家,对科学活动进行的监视、测量以及分析的方法。技术监测的目的就是通过对技术管理活动的监测提供相关的动态信息,从而提高人们应用电子信息技术的水平。 1.2 技术监测的特点 ①科学性。技术监测是对各种数据库、科技文献以及互联网络的信息资源进行数据挖掘,从而为社会的决策提供广泛的数据支持,因此技术监测必要要具有科学性,不能随意的对相关数据进行分析与定性;②经济性。技术监测可以通过对小范围的数据库等进行发现,就可以获得我们所需要的科学数据,从而避免了传统信息评估过程中高成本运作;③独立性。技术监测就是从大量的科技资源数据中发现显性以及隐性的信息资源的过程,这一过程不受任何方面的限制,因此其具有严格意义上的独立性。 2 基于LDA主题模型的科技检测体系 如何在众多的科技文献中发现与抽取文献中具有隐形的语义结构,是当前信息领域监测所主要面对的问题,而LDA主题模型文档建模就是以“主题”为研究对象,通过构建拓扑结构文档表示空间,以此研究科技文献中如何进行主题挖掘的监测问题。 2.1 主题的定义 主题在广义上属于对整个文献的概述与汇总,是对文献思想的升华。在确定“主题”前需要认清 关键词 、主题词、主题之间的关系,根据文献的思想观点,主题的内涵形式化表达方式多样,根据具体的文献资料,文献内容特征表示深度排序为:主题主题词 关键词 。在主题建模表示中,文档的内容一般包括若干个主题,而文档中的特定词汇则可以表现为建模的特定主题,比如我们在分析一篇“文本挖掘”,一半内容属于自然语言处理、五分之二属于概率统计,五分之一属于计算机,另外五分之一表示其它主题:自然语言处理容易出现的词汇包括:文本处理、语法、句法分析以及数据预处理;概率统计容易出现的词汇:概率、模型、召回率以及准确率;计算机容易出现的词汇:系统、时间复杂度、空间复杂度。 2.2 基于主题模型的科技监测体系结构 2.2.1 相关问题分析 基于主题模型的科技监测体系结构主要解决以下问题:如何从大规模的领域文本中发现挖掘隐含的主题?如何对主题的强度进行度量?如何分析主题演化?如何结合科技监测服务内容以扩展基于主题

文档评论(0)

静待花开 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档