对图书情报领域部分高产作者和与研究特色双向聚类探索.pdfVIP

对图书情报领域部分高产作者和与研究特色双向聚类探索.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

PU-21-0006 对图书情报领域部分高产作者和研究特色双向聚类的探索 ∗ ∗ 方丽 崔雷 中国医科大学信息管理与信息系统(医学)系 110001 1 引 言 近年来,利用书目文献数据库进行共现分析的研究已经引起图书情报学、科学学等领域研究人员的关注,很多学 者采用这种方法分析某一学科领域的研究现状和结构,并取得了比较满意的效果。书目文献数据库中可以用于共现分 析的字段主要是在同一个字段中共存多个项目的字段,如论文的作者、主题词或关键词以及引文,其中引文的共现分 析又可以进一步分解为作者同被引、期刊同被引等等。最早开展共现分析的应该是高被引论文的同被引聚类分析。另 一条研究主线则是对主题词或关键词的共现分析。根据这些共现数据,很多学者开展了对高被引论文、高被引作者和 高频主题词的聚类分析,以此将这些分析对象分类。但在现有的研究中,无论是采用系统聚类还是快速(K-means) 聚类的算法,都是单向的聚类,即只对行(对象)或者列(属性)进行聚类,不能对行和列同时进行聚类。本研究尝 试将一种新的双向聚类的方法应用到文献研究中,并通过实例分析其特点。 双向聚类(biclustering, 又称 subspace clustering, coclustering, direct clustering)是对矩阵的行与列 同时进行聚类的一种数据挖掘技术,可以对聚类对象和聚类的属性同时聚类。双向聚类方法在文献计量学领域有广阔 的运用前景。例如,对高被引论文和引用文献的双向聚类可以反映出被引文献和引用文献的对应关系,甚至是同时实 现同被引聚类分析和基于高被引论文的引文耦合分析。作者合著(或单位合作)与相应文献的双向聚类分析可以反映 出作者(单位)合作的具体论文和成果,等等。 本文以图书情报领域中部分高产作者作为聚类对象,以其发表论文的高频主题词作为分类属性,运用双向聚类的 方法,同时对高产作者和论文关键词进行聚类,并进行可视化表达。尝试根据研究特色对某个学科领域内高产作者的 聚类。 2 材料和方法 在中国知识基础设施工程(China National Knowledge Infrastructure, CNKI)中国学术期刊网络出版总库中, 检索 2000-2010 年《中国图书馆学报》和《情报学报》上刊载的所有文献,截至 2010 年 4 月 21 日,查得文献 3033 篇。 利用书目信息共现挖掘系统(Bibliographic Item Co-occurrence Mining System,BIC0MS)对文献集的作者和关 键词进行统计,统计结果为作者 2910 位,与这些作者相关的关键词 5948 个。 2.1 作者的遴选 根据普赖斯定律:“在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作 者总数的平方根”,本文近似地选择高产作者 53 位,见表 1。(sqrt(2910)=53.944) ∗方丽(1987-),女,硕士在读,主要研究信息计量学。 ∗崔雷(1963-),男,硕士,系副主任,教授,主要从事文献计量学和文本挖掘研究。博士生导师。 表 1 图书情报两刊物中作者频次统计表 序号 高产作者 出现频次 序号 高产作者 出现频次 序号 高产作者 出现频次 1 邱均平 59 19 吴慰慈 14 37 贺德方 11 2 侯汉清 31 20 段宇锋 14 38 党延忠 11 3 苏新宁 30 21 陈远 14 39 靖继鹏 11 4 董慧 28 22 郑建明 13 40 崔雷 11 5 张玉峰 27 23 刘兹恒 13 41 王子舟

文档评论(0)

sjatkmvor + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档