- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国内图书馆数据挖掘的研究
国内图书馆数据挖掘的研究
〔摘 要〕目前,国内对于图书馆数据挖掘在资源建设、个性化信息服务、图书馆管理等方面的研究均有不少成果。但是,国内对图书馆数据挖掘的研究仍处于初级阶段,需作进一步深入研究。
〔关键词〕数据挖掘;图书馆;研究述评
〔中图分类号〕G250.74 〔文献标识码〕A 〔文章编号〕1008-0821(2009)01-0128-03
A Review of Studies of the Application of Data Mining in Library
Niu Genyi
(Library,Henan Agricultural University,Zhengzhou 450002,China)
〔Abstract〕In this review,it was throught that Chinese researchers had done quite much on the resources construction,personalized information service,library management for library data mining,while they were still at their early stages and deeper researches should be made.
〔Key words〕data mining;library;research review
数据挖掘一词首次出现在1989年8月举行的第11届国际联合人工智能学术大会上,它是随着数据库技术和人工智能技术的发展而出现的一种新的信息处理技术。从广义上讲,数据挖掘是指从大量不完全、有噪声、模糊和随机的实际应用数据库中,提取隐含的、未知的和潜在有用的知识和信息的过程。数据挖掘的主要特点是对数据库中的大量业务数据进行抽取、转换、分析及模型化处理,并从中提取辅助管理决策的关键性数据。数据挖掘的功能是把人们对数据的应用从低层次的简单查询,提升到了从数据中挖掘有用的信息和知识,从而为管理人员决策提供支持。基于数据挖掘在数据的组织、分析和知识发现等方面的巨大优势和对信息的深层挖掘能力,日益显示出了其强大的发展潜力和广阔的应用前景。如今,数据挖掘技术已经成为计算机科学和信息决策领域的一大研究热点。
1 国内图书馆数据挖掘研究现状
自20世纪90年代后期,国际图书馆界开始关注并研究数据挖掘技术在图书馆的应用,并有不少图书馆学专家提出了面向图书馆的数据挖掘技术应用理论与方法。与国外相比,国内图书馆对数据挖掘的研究稍晚,没有形成整体力量,数据挖掘技术在我国图书馆中还没有大规模地使用。但从有关文献看,数据挖掘在图书馆的应用已经引起了我国图书馆界的关注,相应也出现了一些研究成果。本文将基于对现有研究成果的分析基础上,对国内图书馆数据挖掘研究情况进行评述,旨在理清数据挖掘技术在图书馆应用研究的脉络,促进数据挖掘技术在我国图书馆领域的应用。截至到2008年8月20日,笔者以“数据挖掘”和“图书馆”作为并列题名检索方式在CNKI“中国期刊网全文数据库”中检索到99篇论文,剔除一稿多投3篇,还有96篇。用“数据挖掘”和“图书馆”作为并列题名在维普“中文科技期刊全文数据库”中检索到85篇论文,其中有6篇不含在前面的99篇论文中。这样,发表图书馆数据挖掘学术论文共计102篇。其中2006年以来有65篇,最早的两篇研究论文出现在2002年,一篇为李朝葵发表在《情报杂志》2002年第6期上的《数据挖掘及其在图书馆中的应用》一文;另一篇为王共予和李月丽发表在《现代情报》2002年第9期上的《数据挖掘技术与数字化图书馆建设》一文。发文最多的刊物是《现代情报》,共发有11篇比较重要的论文。在所有论文中,有68篇重点是介绍数据挖掘的定义、内容与特征的,对数据挖掘在图书馆的应用多是泛泛的介绍或者论述很浅。有一定参考价值的论文仅有30多篇。另外,检索CNKI“中国优秀博硕士论文数据库”有8篇硕士学位论文论及数据挖掘技术在图书馆的应用。
2 国内图书馆数据挖掘研究的主要内容
2.1 数据挖掘在图书馆资源建设上的应用研究
综观有关文献,数据挖掘在图书馆资源建设上的应用研究主要体现在通过挖掘文献使用规律,提高文献资源建设的针对性上。具体应用主要反映在以下3个方面:一是通过对用户兴趣模式尤其是学术带头人和专家的Web使用模式挖掘、学科动态分析,结合现有馆藏信息情况,采用合适挖掘算法及时发现信息资源的漏缺,做好文献的收集订购;二是通过Web内容挖掘对Web上大量文档集合内容进行摘要、分类、聚类、关联分析,从大量
文档评论(0)