- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键词共现国内用户研究主题探讨
基于关键词共现国内用户研究主题探讨
【摘要】以2002-2011年我国图情领域关于用户研究的文献为对象,从关键词共现分析、聚类分析、社会网络分析等几个方面对文献中的高频关键词进行定量研究,并将其归类为六大主题。
【关键词】用户 共词分析 社会网络分析 主题归类 核心主题
引言
随着信息化和网络化时代的来临,人们的信息交流日益频繁,信息用户日渐庞大。对用户进行研究已成为我国图情领域研究的前沿和热点,其研究成果可以为信息服务机构开展以用户为中心的服务提供依据。在这一趋势的引领下,图情界同仁迫切希望了解近10年来关于用户研究的热点领域和动态信息,为未来完善用户研究提供有用的借鉴。因此,笔者采用共词分析法和社会网络分析法对2002-2011年我国图情领域关于用户研究文献中的高频关键词进行分析,以揭示用户研究的主题,把握其发展趋势。
共词分析法主要是利用文献集中关键词对共同出现的情况来确定该文献集所代表学科中各主题之间的关系。一般做法是统计一组文献的关键词两两之间在同一篇文献中出现的频率,便可形成一个由这些词对关联所组成的共词网络。利用聚类、因子分析等多元统计分析方法对共词网络进行分析,进而展现该学科的研究结构[1]。
社会网络分析法原本是社会学用于研究社会成员之间关系的一种定量方法,后来被引入到了图情领域的相关研究。它在关键词分析中应用的主要原理是将关键词作为网络的节点,关键词之间的共现关系则构成节点之间的连线,构建社会网络关系图谱,然后应用中心度、小世界效应等方法进行分析,进而发掘出关键词之间的关系 [2]。
2.1 数据来源
为了尽可能保证查全率,笔者以“用户”、“信息用户”为题名和关键词,对中国知网和维普网收录的19种图情领域核心期刊进行检索。共得到2002-2011年发表的论文2 632篇,剔除非学术论文、重复等无效部分后,最终有效篇数为2 115篇。
19种核心期刊分别是:《情报学报》、《图书情报工作》、《国家图书馆学刊》、《图书与情报》、《图书馆学研究》、《图书馆工作与研究》、《图书馆理论与实践》、《情报杂志》??《情报科学》、《图书馆杂志》、《图书馆建设》、《图书馆论坛》、《图书馆》、《图书情报知识》、《情报理论与实践》、《中国图书馆学报》、《大学图书馆学报》、《情报资料工作》、《现代图书情报技术》。除了《情报学报》上发表的文献来自于维普网外,其他均来自于中国知网。
2.2 数据预处理
由于关键词是论文作者自行选择的自然语言,因此会存在一些不规范、不统一的现象。为了让研究结果更加准确,笔者采用归并、吸收和丢弃三种方法对关键词进行逐一的人工处理。
归并法是指对同一内容用不同词语来表达或者同一词语用不同语种来表示的情况,归并为统一的词语。如用户、读者和信息需求者等,归并为用户; Lib2.0、Library2.0和图书馆2.0,归并为图书馆2.0。
吸收法是指针对同一研究内容,但却采用上下位关系来表示的关键词,如用户、图书馆用户和信息用户,采用上位类代替下位类的方式进行吸收,即采用用户来表示。有些词需要采用下位类吸收上位类的方式,如模型和用户模型,这需要结合文献的具体内容而定。
丢弃法是指针对一些与用户研究无关或者太宽泛的关键词,如学校机构的名称(中央财经大学)、趋势、google工具栏、21世纪等,将这些关键词丢弃而不纳入统计分析范畴。同时,由于本文研究的文章都是来源于图情领域,这些文章包含“图书馆”这个关键词的频率较高,为了使得研究结果更加准确和客观,把这个关键词也剔除。
按照上述方式,采用自编的C语言程序进行统计,共得到关键词3 256个。结合齐普夫第二定律以及关键词频次变化曲线,选取频次大于20的34个高频关键词,如表1所示:
2.3 构建共词矩阵
为反映关键词之间的关系,笔者统计高频关键词两两共现的情况,构建出34×34的共词矩阵(见表2)。由于关键词共现的频次直接受到各自词频大小的影响,因此原始共词矩阵难以反映关键词之间真正的依赖程度。为了消除这种现象,笔者采取常用的Ochiia系数对关键词对进行了包容化处理,将原始共词矩阵转换为相似矩阵。Ochiia系数计算公式为: ,其中 表示关键词 和 共现的频次, 分别表示关键词 和 的频次。
由于构建的相似矩阵为0值过多的稀疏矩阵,为方便后续处理,用1与全部相似矩阵中的数据相减,得到表示关键词对的相异矩阵(表3),作为后面分析的矩阵变量。相异矩阵中的值越大表示两个关键词对联系越不紧密,值越小表明联系越紧密。
2.4 研究方法
因子分析法。该方法的目的是用少数几个因子去描述众多指标或因素之间的联系,其基本原理是把比较密切的几个变量归在同一类中,每一类变
您可能关注的文档
最近下载
- 九级物理_第十三章内能与热机.ppt VIP
- 2024年教育综合333考研统考真题及解析.pdf VIP
- 综合与实践 数字编码 教案 2025人教版数学三年级上册.doc VIP
- 灵宝道情与道教文化.pdf VIP
- 企业财务共享中心建设以山西焦煤集团为例.docx VIP
- 2025至2030中国军事上的人工智能行业项目调研及市场前景预测评估报告.docx
- 2025考研教育学333真题及参考答案.docx VIP
- 关于绑架的小故事-绑架关起来的故事.docx VIP
- 2025年人教版三年级数学上册综合实践《数字编码》教案.pdf VIP
- 2.7《运动的快慢》(课件)四年级上册科学苏教版.pptx VIP
文档评论(0)