精華版Bibexcel进行中医方剂和药物分析指南.docxVIP

精華版Bibexcel进行中医方剂和药物分析指南.docx

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精華版Bibexcel进行中医方剂和药物分析指南

Bibexcel进行文献计量分析指南——分析文本数据(中医方剂和药物分析)一、软件简介Bibexcel是一个用于文献计量分析、特别是引文分析的完美工具。用户可以在www.umu.se/inforsk网站上获得最新版本(据本人验证,应该是http://www8.umu.se/inforsk/Bibexcel/这个网站)。其安装也十分简单,只需要把文件拷贝到硬盘的目录下即可。记住,要把帮助文档即:也放在同一个目录下(在bibexcel打开的情况下,按下F1即可出现帮助系统的内容,不过是全英文的)。如果本指南不能满足你的需求请到该网站上浏览网页。Bibexcel 因其灵活性而十分强大,但过于灵活会在刚开始使用的时候会带来一点点困惑,有的时候好几件事情通过一个步骤就完成了,有的时候需要把几种不同数据集结合在一起来处理文件。使用Bibexcel过程中需要帮助的时候可以按F1获得帮助,但是这个帮助往往是面向比较熟练的用户,老用户明确自己要做什么因而需要略加指点后在Bibexcel下完成的任务。幸运的是还有一些笔记来填充教程和快速指南留下的空缺。二、原理介绍Bibexcel软件的核心原理是“共词分析法”。该方法最早起源于20 世纪70 年代中后期,属于内容分析法的一种。该方法主要统计一组词中两两之间同时出现于一篇文献的次数,以这种“共现”次数反映这些词之间的关联程度,然后借助聚类方法可分析学科的主题结构。共词分析法的原理可描述为:两个词的“共词强度” (指两个词同时出现于一篇论文中的次数)越高,则这两个词之间的关联越紧密。1 定义共词分析(Co-word Analysis)是通过对反映文献主题内容的关键词进行统计分析,研究文献内在联系和科学结构。?2 流程2.1 确定分析问题2.2 确定分析单元一种是从关键词列表、标题、摘要等进行提取;另一种数据收集方式则是利用专门的语词提取软件直接从全文抽取。(本文讲的方法与此有相似之处)2.3 高频词的选定高频词的确定主要有两种方法:一种是结合研究者的经验在选词个数和词频高度上平衡,该方法具有一定的主观性;另一种是结合齐普夫第二定律辅助判定高频词的界限。(齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。)(但是齐普夫的表达仅适宜于中频词的情况,高频与低频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研究。)2.4 计算共词频率,得到共词矩阵在共词分析中,为方便词对共现频率的运算。设计共词矩阵,对于N个高频词的共词分析中,便形成一个N-N的共词矩阵。共词矩阵的计算方法有如下几种:包容指数法、临近指数法、相互包容系数法。2.5 对共词矩阵进行处理,揭示共词信息常用的分析方法如下。(1)共词聚类分析法借助数据挖掘中的聚类分析法,对共词关系网络中的词与词之同的距离进行数学运算分析,将距离较近的主题词聚集起来,形成一个个概念相对独立的类团。类团分析是共词聚类分析的核心内容。(2)共词关联分析法在共词关联分析的过程,涉及到4个重要的概念:支持度、置信度、期望可信度、作用度。(3)共词词频分析法词频分析法是利用能够揭示或表达文献核心内容的关键主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法,是定性分析法的一种。(4)突发词监测法突发词监测是Kleinberg于2002年提出话题的突发监测(Brust detection)算法,它关注焦点词一相对增长率突然增长的词。基于单个词的词频增长率变化更有可能涉及到领域局部热点的变化。?3 应用领域(1)揭示特定领域内的研究主题及其层次之间的关系,以及其对应的研究方向间的关系,划分科学子研究领域并确定其研究结构;(2)从横向和纵向角度揭示特定领域内研究主题之间以及同其他研究主题之间的关系;(3)考察特定研究领域内研究主题发展的历史脉络及其子领域的演进态势;(4)通过词间关系的数据挖掘达到学科主题知识发现的目的。三、软件操作——以分析文本文档为例由于Bibexcel设计之初是专门用于文献计量分析、特别是引文分析的工具,该软件用于对文献的关键词、标题、摘要、期刊等进行提取和分析。所以,在进行介绍本文的用bibexcel软件进行中医药方剂和药物分析的方法之前,先大概介绍一下bibexcel软件正统的用法和意义。两种用法的差别在于,用于bibexcel分析的起始文本文档不同,其他的后续分析的操作方法,均一样。(有点长,着急者,可以略过不

您可能关注的文档

文档评论(0)

df9v4fzI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档