- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
科学知识图谱与数据可视化工具使用——TDA、citespace以及社会网络分析工具Ucinet、Gephi和Pajek ;提纲; 定义
科学知识图谱是一种以科学知识为计量研究对象, 将复杂的科学知识领域通过数据挖掘、信息处理、知识计量和可视化的方式显示科学知识的发展进程与结构关系, 揭示科学知识及其活动规律, 展现知识结构关系与演进规律。
知识图谱的最大优点是一种利用空间形态来形象地表现学科、领域、专业、文献或作者间的相互关系,通过引文分析、共现分析等分析方法来发现学科内和子学科间的联系,掌握当前学术研究的热点问题,预测学科的发展方向。;提纲;1.2 科学知识图谱基本方法; 引文分析
引文分析主要运用数学和逻辑学等方法对期刊、论文、专著、学科、作者等研究对象的引用和被引用现象和规律进行分析, 以便揭示其数量特征和内在规律。一篇文献的被引频次可以在一定程度上反映该文献的影响度, 而影响度的大小又在一定程度上反映了该文献质量和水平的高低。
3种基本类型的引文分析
( 1 )从引文数量上进行研究,主要用于评价期刊、论文、机构、作者及地区的科研水平;
( 2)从引文间的网状关系或链状关系进行研究, 主要用于揭示学科的发展与联系, 并展望未来前景等;
( 3)从引文反映出的主题相关性方面进行研究, 主要用于揭示科学的结构和进行文献检索等。
;同被引分析;共词分析;词频分析
词频是指一个词在文章或者讲话中出现的次数。通过对主题词出现的频率进行分析, 可以找到某一领域或学科的研究热点, 并有可能发现研究热点的转移趋势。词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法 。由于一篇文献的关键词或主题词是文章核心内容的浓缩和提炼, 因此, 如果某一关键词或主题词在其所在领域的文献中反复出现, 则可反映出该关键词或主题词所表征的研究主题是该领域的研究热点。
;社会网络分析;;多维尺度分析;提纲;1.3 科学知识图谱的主要应用;科学知识图谱在专利引文分析中的作用
专利文献在经济学意义上所具有的特殊价值。世界上第一部专利文献的引文索引是1964 年出版的SC I, 它不仅列出了出现在期刊文献中的专利引文, 而且还包括了专利中的引文。这种索引充分发挥了引文分析用于专利文献检索的全部功能 。
专利引文分析通过对专利文献的参考引文进行计量学统计分析, 从而揭示技术发展的历史和现状,并据此进行技术评价及预测 。采用科学知识图谱, 通过对专利文献之间相互引证关系的分析和研究, 能通过可视化的图像更好地评价和定位某一专利, 同时也能洞察某一专业领域内的研发现状和技术水平。
;科学知识图谱用于各学科的计量学研究
科学知识图谱属于科学计量学研究的范畴, 基于引文分析的科学知识图谱可用于以下几方面:
( 1)分析学科进展及发展趋势;
( 2) 分析学科核心作者群;
( 3)分析学科核心期刊群体的结构;
( 4) 分析时空分布特征、主要热点领域、研究前沿、动态和发展趋势;
( 5) 分析了论文产出的主要领域、国家、机构、科学家和期刊。
此外, 科学知识图谱还可用于制定科学决策的依据; 确定研究的热点、方法、学科分布和应用领域;揭示相关文献所代表的特定领域内的研究主题、主题的层级及其关系以及由研究主题所映射的具体研究方向之间的关系; 揭示研究主题接近所属领域热点问题的程度; 考察特定领域内科学研究主题的变迁; 预测特定领域的知识发展趋势等方面。;提纲;1.4 绘制科学知识图谱的软件;TDA的优点
不同的平台的数据
有数据清洗功能,可以自动清洗和人工清洗。
强大的数据分析功能,包括一维分析、二维矩阵分析和三维分析。有预制的分析模块,可以生成分析报告。
TDA的缺点
可视化图效果较弱。
;CiteSpace的优点
1. CiteSpace 的功能比较强大,可以基于文献绘制各类的知识图谱。同时它也提供聚类、时间序列和时区三种图谱布局。
2. 将文献计量数据关系与社会网络分析方法结合起来,可视化效果好。
节点的大小代表了该节点的中心度。
节点年轮的厚度代表了该节点在不同年份的被引情况。
节点的颜色,它随着年份的变化而变化,观察颜色的变化可以看出该学科的热点动向。
节点与节点之间的连线粗细代表节点之间的共现频次。;CiteSpace的缺点
没有直接数据清洗功能,需要借助SQL或其他文本处理工具进行。
有些聚类效果不理想,尤其合作网络。
图的解释问题,需要较深专业基础。;Ucinet(Netdraw)、Gephi和Pajek等是社会网络分析工具,只能识别矩阵数据,因此在处理文献计量数据时,需要借助其他的文献计量工具
文档评论(0)