- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
词频分析及常用工具比较研究.pdf
图书馆学刊 2016 军第6 期
TUSHUGUANXUEKAN NO.6 , 2016 …llfal萄园揭!
词频分析及常用工具比较研究*
左丽华
(浙江工业大学图书馆,浙江杭州I 310023)
[摘 要]首先梳理了词频分析的一般过程并对现有词频分析工具总结归类。在此基础上,从软件基本信息、支持
数据类型、数据预处理、数据分析与结果导出等方面对国内常用词频分析工具Bibexcel、 CiteSpace 和SATI进行了比较
分析。并以WOS数据库为数据源,对3 个软件实际分析结果进行比较,以期为科研人员使用词频分析方法提供有益
的帮助。
[关键词]词频分析 Bibexcel CiteSpace SATI
[分类号]G252.8
策略的制定对最后的结果分析有直接影响;检索并评估检索
1 词频分析及现状
结果,如果首次检索结果不理想需重新调整检索策略再次进
词频分析是文献计量学中传统的和具有代表性的一种
行检索:数据采集下载,通过人工判读删除无用数据,然后下
内容分析方法,基本原理是通过词出现频次多少的变化,来
载数据。数据清洗加工,词频分析最终结果的可靠性很大程
确定热点及其变化趋势[町,目前巳经在各学科领域得到广泛
度上依赖于原始数据的准确性,清洗对下载的数据进行筛
应用。笔者通过对国内文献调研发现,国内研究人员多运用
选、去重和勘误,常常需要人工识别。最后是数据分析,借助
一种分析工具对特定学科领域某个时间段的文献所使用的
分析工具对下载的题录数据进行抽取,从标题、摘要或关键
关键词进行分析,依据分析结果确定特定学科研究热点。已
词抽取的词汇,根据关键词的词频数,选定高频关键词,对高
有的研究成果侧重特定词频分析工具在具体领域的应用,对
频关键词详细分析,除了统计分析还可以进行深入的文本挖
词频分析过程及分析工具本身的探讨较少。由于词频分析
掘和可视化。这些过程结束之后对结果进行解释并得到一
工具众多且分析过程各有差异,利用不同的分析软件处理相
些结论。
同的数据所得结果也不尽相同。因此有必要对词频分析的
3 词频分析工具类型
过程进行梳理,并对词频分析工具进行对比研究。该研究有
助于研究人员在定性判断领域研究热点基础上,快速地选择
计量分析中常用的词频分析工具可分为3 类:①研究人
词频分析工具对领域研究热点进行→个量的判断。
员自主开发软件,编写程序实现相关题录信息的处理,如《基
2 词频分析过程 于词频分析的国内情报学研究热点沪一文,作者选用了Java
语言编程实现关键词抽取和统计。这种方法要求研究人员
词频分析一般的过程主要分为数据检索、清洗加工、词
具有→定的编程水平。②利用SPSS、 Excel、 NoteExp
文档评论(0)