- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
针对科技路线图的文本挖掘研究集成分析及可视化.pdf
针对科技路线图的文本挖掘研究:
集成分析及可视化冰
谢秀芳 1【 张晓林
(中国科学院文献情报 中心 北京 100190)
(首都医科大学卫生管理与教育学院 /首都医科大学图书馆 北京 100069)
摘要: 【目的】实现针对科技路线图内容的知识发现研究,预测未来科技长期发展趋势。【方法 】基于采用 抽“取
一 同步一分类”的文本挖掘方法构建的科技路线图信息库,集成分析全球科技发展需求和趋势 对比分析各国发展
路线和措施,并以可再生能源领域为案例进行实证研究。【结果】利用开源工具Timeflow、Gephi等对实证研究
结果进行可视化,按时间序列从多个角度呈现了可再生能源领域到 2050年的发展态势及各国的战略规划 。
【局限 】综合利用了多种方法工具,自动化程度有待提高,个性化功能有待完善。【结论】该研究方案能够快速获
取科技路线图中的核心信息,提高情报获取效率。
关键词:科技路线图 战略情报 文本挖掘 知识发现 集成分析 信息可视化
分类号:G356.4
进而可以基于该特征知识库实现对大量科技路线图的
1 引 言
集成分析、对 比分析、趋势分析等,实现对科技路线
科技路线图是关于世界各 国未来科技发展规划最 图的文本挖掘和知识发现 9【]。
直接的战略情报载体,蕴涵着各国科技发展现状、方 本文基于文献[10】提出的信息抽取方法构建的科
向、相关技术发展进程 、愿景、阶段性 目标、战略措 技路线图信息库,集成分析全球各国在各个领域的战
施等多方面信息,是一种密集型战略情报资源。利用 略规划信息,分析每个领域在世界范围内的发展现状,
文本挖掘技术实现对科技路线图的信息抽取、分类组 并预测未来发展趋势,从而实现针对科技路线图文本
织和集成分析,对把握未来科技发展方向,制定长期 内容的知识发现过程,为决策者制定相关领域发展计
发展规划具有重要战略意义I”。 划提供战略情报服务。
然而科技路线图在情报学领域更多属于情报研究
2 科技路线图集成对 比分析功能框架
的产物2【4],较少作为情报挖掘的数据资源[5_6]。比较常
见的是对某个具体的路线图报告进行人工解读[7墙],鲜 本研究前期调研分析了全球 21个 国家或组织发
有针对大量科技路线图报告进行文本挖掘研究。因此 布的 166份科技路线图,构建了科技路线图内容描述
本研究提出针对科技路线图的文本挖掘研究方案,通 框架和信息分类体系 ,并在此基础上探索了针对科
过分析科技路线图的内容组织和表达特征,探索科技 技路线图文本内容的信息抽取方法 【1,依次进行文本
路线图信息 自动抽取方法,建立科技路线图知识库, 清洗、信息抽取、数据清洗、同步匹配、信息分类等
通讯作者:谢秀芳,ORCID:0000—0002—7405—9844,E—mail:xiexiufang@mail.1as.ac.cn。
本文系中国科学院规划与决策科技支持系统建设项 目“科技决策知识服务平台”(项耳编号:院1405)的研究成果之一。
圜 数据分析与知识发现
总第 l期 2017年 第 1期
步骤,形成了包含文本基础信息、语义分类信 自、、内 技路线图信息库(见罔 1)其中语义分类信息的取值源
容核心信息、句子原始信息4类,共计 19个字段的科 自信息分类体系 中的分类项.如图2所示
·ID doc ·Classiflcation l ·Keyword ·ID sentence
_
文档评论(0)