聚类分析在图书馆管理中应用研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析在图书馆管理中应用研究

聚类分析在图书馆管理中应用研究   摘 要:聚类分析是数据挖掘中的一种非监督分类技术。聚类分析作为辅助技术在图书馆管理中发挥了巨大的作用。本文在介绍聚类分析的基础上,分析了聚类分析在图书馆管理中的应用研究,指出当前聚类分析算法存在的不足,提出新的聚类分析方法。   关键词:聚类分析;数据挖掘;非监督学习;图书馆管理   中图分类号:G25 文献标识码:A   高等学校图书馆作为高校信息服务中心,提供高等学校教学和科学研究服务,是培养人才和开展科学研究的重要基地之一,在高校发挥着举足轻重的作用。随着大学教育的发展,高校图书馆的藏书量大幅度增长,随着计算机技术的普及和信息资源的日益增长,高校数字图书馆数据呈几何倍数增长。面对这些海量数据,为更好地推动高校图书馆管理,学者们相继提出了各自的聚类分析算法,聚类分析也成为高校图书馆管理中的重要研究技术之一。   本文结合图书馆管理中的应用,概述聚类分析的基础上,对聚类分析在图书馆管理中的应用研究进行分析,指出当前聚类分析算法存在的不足,提出新的聚类分析方法,从而推进聚类分析在图书馆管理中技术研究。   1 聚类分析概述   需求是发明之母。20世纪70年代初,数据挖掘成为了慢慢兴起的数据智能分析技术,引起专家学者们的极大关注,主要源于存在大量数据,而这些数据也迫切需要转换成有用的信息和知识。在这一历史发展阶段,聚类分析是数据挖掘研究领域的重点课题。   1.1 聚类分析概念   数据挖掘(Data Mining,DM)又译为资料探斟,它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的、随机的、不完全的、模糊的、有噪声的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘的任务主要包含关联分析、聚类分析、分类、预测、时序模式和偏差分析等。聚类分析(Clustering analysis)正是数据挖掘中的一项重要任务。聚类分析以“物以类聚”作为划分依据,将按相似性将数据归纳成若干类别,相同类别的数据相似,不相同类别的数据彼此相异,聚类过程中划为一组的称为一个类(Cluster)。于是可以得出聚类分析的数学表达方式:   对于数据集合V{vi|i=1,2,...,n},这里,vi为数据对象,依据数据对象之间的相近程度将数据集合V划分成k组,满足以下条件   这一过程称为聚类分析,Ci(i=1,2,...,n)称为类(或簇)。   1.2 聚类分析原理   用有序对(x,s)或(x,d)表示输入,s和d表示聚类样本数据之间的相似程度和相异程度标准。x={G1,G2,...,Gk}作为输出,其中Gk(k=1,2,...,N)为x的子集,即满足以下条件   子集G1,G2,...,Gk称为类,这些子集都是通过一些关键特征进行描述的。通常,可以通过这些样本集合的重心或类(簇)中关系的点来表示n维空间的一类;或借助聚类树的方式用于表示一类;或通过样本点属性的逻辑表达式表示一类。   1.3 聚类分析算法   聚类分析有许多种不同的方法,主要包含以下几种:层次聚类方法、划分聚类方法、基于密度的聚类、基于网格的算法和基于模型的算法。以下给出聚类分析算法的分类及代表算法。   2 聚类分析在图书馆管理中应用研究   伴随着计算机网络技术的快速发展,高校图书馆的藏书量大幅度增长,高校图书馆在人才培养和科学研究中所占的位置也日益提升,除了传统模式的图书馆管理外,数字图书馆也迅速在高校推广起来。   2.1 聚类分析在图书管理系统中的应用   在图书管理中,运用聚类分析技术主要体现在以下几个方面。比如,从样本数据中分析出读者的阅读倾向。如孙凌云在论文中分析了高校学生读者的阅读倾向,以及给出图书馆的相关对策;吴志强在论文中应用了聚类分析来研究读者阅读倾向问题;孙锐等在论文中以重庆大学图书馆作为研究背景,通过图书预约数据对读者阅读倾向展开研究。另外,运用聚类分析算法创建图书推荐系统。如孙彦超在其论文中,将读者“查找”图书转变为向读者“推荐”图书,运用聚类分析来向读者更好地推荐;王家胜在论文中提出了基于SPSS Clementine的聚类模型,并用于对读者群体进行细分。聚类分析技术应用于图书馆管理系统中,不仅能充分了解到读者的兴趣和需求,还可以为图书管理部门开展图书采购计划提供及时可靠的数据依据。从而将传统管理系统中的被动服务转化为主动服务,更好地发挥图书馆的功能。   2.2 聚类分析在数字图书馆中的应用   相比传统图书馆管理模式,随着时间的迁移,高校数字图书馆数据呈几何倍数增长。面对这些海量数据,为更好地推动高校图书馆管理,学者们运用聚类分析算法也提出了相应的改革措施。如潘旭武等在论文中提出运用数据挖掘技术对数字图书馆进行结构挖掘、内容挖掘和用户使用记录的挖掘。张付志

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档