词频分析及常用工具比较研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
词频分析及常用工具比较研究.pdf

图书馆学刊 2016 军第6 期 TUSHUGUANXUEKAN NO.6 , 2016 …llfal萄园揭! 词频分析及常用工具比较研究* 左丽华 (浙江工业大学图书馆,浙江杭州I 310023) [摘 要]首先梳理了词频分析的一般过程并对现有词频分析工具总结归类。在此基础上,从软件基本信息、支持 数据类型、数据预处理、数据分析与结果导出等方面对国内常用词频分析工具Bibexcel、 CiteSpace 和SATI进行了比较 分析。并以WOS数据库为数据源,对3 个软件实际分析结果进行比较,以期为科研人员使用词频分析方法提供有益 的帮助。 [关键词]词频分析 Bibexcel CiteSpace SATI [分类号]G252.8 策略的制定对最后的结果分析有直接影响;检索并评估检索 1 词频分析及现状 结果,如果首次检索结果不理想需重新调整检索策略再次进 词频分析是文献计量学中传统的和具有代表性的一种 行检索:数据采集下载,通过人工判读删除无用数据,然后下 内容分析方法,基本原理是通过词出现频次多少的变化,来 载数据。数据清洗加工,词频分析最终结果的可靠性很大程 确定热点及其变化趋势[町,目前巳经在各学科领域得到广泛 度上依赖于原始数据的准确性,清洗对下载的数据进行筛 应用。笔者通过对国内文献调研发现,国内研究人员多运用 选、去重和勘误,常常需要人工识别。最后是数据分析,借助 一种分析工具对特定学科领域某个时间段的文献所使用的 分析工具对下载的题录数据进行抽取,从标题、摘要或关键 关键词进行分析,依据分析结果确定特定学科研究热点。已 词抽取的词汇,根据关键词的词频数,选定高频关键词,对高 有的研究成果侧重特定词频分析工具在具体领域的应用,对 频关键词详细分析,除了统计分析还可以进行深入的文本挖 词频分析过程及分析工具本身的探讨较少。由于词频分析 掘和可视化。这些过程结束之后对结果进行解释并得到一 工具众多且分析过程各有差异,利用不同的分析软件处理相 些结论。 同的数据所得结果也不尽相同。因此有必要对词频分析的 3 词频分析工具类型 过程进行梳理,并对词频分析工具进行对比研究。该研究有 助于研究人员在定性判断领域研究热点基础上,快速地选择 计量分析中常用的词频分析工具可分为3 类:①研究人 词频分析工具对领域研究热点进行→个量的判断。 员自主开发软件,编写程序实现相关题录信息的处理,如《基 2 词频分析过程 于词频分析的国内情报学研究热点沪一文,作者选用了Java 语言编程实现关键词抽取和统计。这种方法要求研究人员 词频分析一般的过程主要分为数据检索、清洗加工、词 具有→定的编程水平。②利用SPSS、 Excel、 NoteExp

文档评论(0)

170****0571 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档