IntroductionofSATI.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IntroductionofSATI

软件说明 / Introduction Version SATI 更新说明: 1、【简介】【帮助文档】更新。 2、添加中文分词等【实用工具】模块。 文献题录信息统计分析工具(Statistical Analysis Toolkit for Informetrics, SATI),通过免费、共享软件功能及开源、增进代码实现,旨在为学术研究提供 数据统计与分析辅助工具。 软件简介: 背景: 通过统计和分析期刊数据以挖掘出实用的模式和隐藏的信息,已成为识别学 科热点或探索学科前沿的重要方法之一,而全文期刊数据库所收录的电子期刊文 献自然成为数据源的首选。题录作为描述文献外部特征的重要条目集合,利用适 当的信息抽取技术和定量分析方法,即可以题录为媒介,深入发掘和呈现出美妙 的数据统计分析结果。对信息技术的掌握可使得我们编写出控制台程序或者窗体 软件,以往需要进行大量手工分析运算的工作如今可以迅速直接的从数据本身得 出结论。目前针对题录信息统计分析而开发的软件以国外较多,其数据源大都为 国外数据库(WOS)导出文件,并且多为大型、复杂软件难以操作,为提供一 个专门分析国内期刊论文题录信息,同时拥有分析WOS题录数据功能的小巧精 准工具,以抽取指定字段信息、统计条目出现频率、构建知识单元共现矩阵,特 作此软件和说明。 目的: 1、提供开源软件,辅助研究者统计分析文献题录信息或构建共现矩阵; 2、只提供中间数据生成,不代表最终研究结果,即现成大型软件具备的后 续功能(如基于词频排序构建图表,基于共现矩阵进行聚类分析、制作网络知识 图谱等)自然不必开发; 3、个人为学习.NET相关技术而作。 方法: 开发平台:.NET Framwork 4.0;技术语言:C#, WinForm 功能模块: 1、字段信息抽取:支持WOS导出的HTML格式、EndNote格式和NoteExpress 格式三种格式题录数据,抽取题录中指定的字段信息并可选择存储为文本文档 (包括:自定义字段、关键词、主题词、作者、引文、机构、发表年、标题、期 刊名、文献类型、摘要、URL等字段)。 2、条目频次统计:根据抽取到的字段信息对条目内元素的频次进行统计和 降序排列(包括:自定义标识、关键词、主题词、作者、引文、机构、发表年、 标题、期刊、文献类型等)。 3、共现矩阵构建:根据设定的共现矩阵行列数,将频次降序排列表中的相 应数量条目元素作为矩阵知识单元进行运算,以构建知识单元共现矩阵(包括: 关键词共现矩阵、主题词共现矩阵、作者共现矩阵、引文共现矩阵、机构共现矩 阵等)并生成 EXCEL格式文档,进而可以基于此矩阵文档导入相关软件(如 Ucinet、Netdraw等可视化分析软件)生成共现网络知识图谱。 提示说明: 数据源: 目前本软件支持三种格式题录数据(EndNote格式、NoteExpress格式和 HTML(WOS)格式)。 1、EndNote格式:推荐使用中国知网(CNKI)导出 EndNote格式的题录数据, 因为知网提供的 EndNote格式题录数据较为完整,万方数据(WF)提供的 EndNote 格式题录数据中作者字段只显示第一作者。 2、NoteExpress格式:推荐使用万方数据(WF)提供的 NoteExpress格式题录 数据,因为万方提供的 NoteExpress格式题录数据较为完整,中国知网(CNKI)提 供的此类数据缺少关键词字段数据。 3、HTML(WOS)格式:Web of Science数据库平台导出的 HTML格式题录数 据。 操作流程:具体参照软件【简介】—【帮助文档】。 作者的话: 有待完成: 1、依据数据统计结果构建图表; 2、直接对矩阵进行分析得出结论,并于软件本身呈现出可视化结果。 3、添加智能信息处理相关技术功能模块(如聚类分析)。 5/28/2011:一个星期时间规划、设计和开发出的软件自然不敢与同类大型工具软件相提并 论,带着对.NET平台和 C#语言的满腔热爱,在学习.NET相关技术的基础之上将 C#和 WinForm付诸实践,与花费的时间精力和消耗掉的脑细胞相比,这才是我最开心的事。 就软件而言,较上个版本 CS1,与 Access数据库的链接功能模块已被删除,添加了设 定矩阵行列数的功能,增加矩阵导出结果的 EXCEL文档格式(最大 100×100,毕竟高频词 共现矩阵和高引(高产)作者合作矩阵才是有实际意义的),为后续导入可视化分析软件提 供极大便利,鉴于国内全文期刊数据库导出的题录数据在格式统一度和信息量上的劣势,软 件在字段抽取和信息统计的功能上只能做到此地步,相信随着技术的进步,此现象会有大改 善。 衡

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档