数据挖掘在图书馆管理中理论与技术_000002.docVIP

数据挖掘在图书馆管理中理论与技术_000002.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在图书馆管理中理论与技术_000002

数据挖掘在图书馆管理中理论与技术_000002   【摘 要】随着数据挖掘技术的发展,其应用领域也得到了进一步的拓展,图书馆的现代化建设也因此迎来了新的机遇,在图书馆文献管理过程中,每天都产生大量的读者借阅数据,合理地利用这些有价值的信息对图书馆的采购、馆藏、咨询等业务工作有着很大的指导作用。通过应用数据挖掘技术,图书馆管理者能够更加全面地了解读者访问图书馆的趋势和目的,进一步的改善图书馆系统的人性化服务,为图书馆现代化管理提供技术支持和决策管理支持。   【关键词】数据挖掘;图书馆管理;技术   1 技术背景   随着信息技术和计算机技术的向前发展,近些年信息量呈现爆发式增长,这些超大型数据库能够涉及社会的科学研究、政府部门、天文学、超级市场、行政办公、金融机构等领域,使得传统信息分析方法在一定得程度上不能满足现实的需求。在这种背景下,信息和知识的数据挖掘技术慢慢走入人们的视野。   2 课题研究意义和目的   图书馆作为学术性、科研性、服务性机构,在学校的教学及科研中承担着重要角色,迫切需要聚类分析、序列模式分析、关联分析、分类分析和概念描述等数据挖掘的技术对获取的信息做进一步的加工,以此来更好的发展图书馆管理业务。   文献管理集成系统能够很好的对文献信息资源进行资源共享、有效的开发、科学的管理,这些也恰恰是数字化图书馆建设的重要内容。   3 国内外研究现状   随着互联网技术的快速发展以及市场交易量的逐步扩大,数据挖掘系统的应用也越来越普遍。目前,数据挖掘系统的研究与应用主要集中在医药、天体、电信、零售、体育、营销分析、农业、生物、电力、化工和金融等行业。   在我国,国家自然科学基金对数据挖掘的研究提供支持是在1993年,自此之后,我国很多高等院校和科研单位相继开展发现知识的基础理论研究工作,参与的单位主要有:海军装备论证中心、空军第三研究所、中科院计算技术研究所、清华大学等。其中,在知识发现应用领域中应用模糊方法的研究单位有北京系统工程研究所;对数据立方体代数的研究单位有北京大学;对关联规则开采算法的改造和优化进行了深入研究的单位有华中科技大学、复旦大学、吉林大学、中科院数学研究所、中国科技大学、浙江大学等单位;对非结构化数据的Web数据挖掘以及知识发现研究的单位主要有上海交通大学、四川大学和南京大学等。   在图书馆领域方面,《中国学术文献网络出版总库》(国家“十一五”重大出版工程项目)的建设取得了很好的突破,“网上个人与机构数字图书馆”系统在2008上半年正式投入使用。“网上个人与机构数字图书馆”已经整合《中国学术文献网络出版总库》出版的国内期刊、本博硕士学位论文、会议论文、报纸文献、工具书和年鉴数目分别为9000多种、60多万篇、90多万篇、800多万篇、1600多种和2300多种,同时还整合了科技成果、标准、专利等各类资源。该体系是在知识管理系统(由清华大学开发)的基础上开发出的信息资源服务系统,能够自由定制多种个性化服务,为各类医务人员、公务人员、技术人员、科研人员、管理人员和单位服务,具有实时性、自动化、专业化、个性化的特点。   4 数据挖掘概念   数据挖掘就是从随机的、不完全的、模糊的、有噪声的、大量的应用数据中,挖掘出潜在有用的、事先不知道的、隐含在其中的知识和信息的过程。   从概念上来讲,与数据挖掘相近的有决策支持、数据分析和数据融合等。该概念可能包括的含义有:数据源必须是含噪声的、大量的、真实的;发现的知识是用户所感兴趣的;并不要求知识在任何情况都被人们所接受;发现的知识要可运用、可理解、可接受。   从本质上说,与传统的数据分析相比,数据挖掘可以理解为是在不带任何针对性的条件下去发现知识、挖掘信息,其挖掘出来的信息主要特征有三个,分别为可实用,有效和先未知。   5 数据挖掘的技术   在数据挖掘的过程中,需要采用一定的技术,常用的主要有:关联规则方法、统计技术、神经元网络、决策树和规则推理、连接分析、聚集检测、基于历史的分析MBR方法、遗传算法等。   5.1 关联规则方法   关联规则是数据库中某些特定事件一起发生的概率的简单陈述。运用一定的方法来发现数据库中隐藏的关联规则这个经过是关联规则挖掘。现在数据挖掘领域的研究中关键的一个方向是关联规则挖掘的研究。   5.2 统计技术   挖掘数据集利用统计技术,操作原则是针对已给的数据集合先预设一个概率的模型或者正态分布,后运用特定的方法挖掘模型。   5.3 神经元网络   因特网是由服务器互联形成,而神经网络是由诸多神经元互联形成的,两者形成原理较为相似。可以根据组织的特征或者“神经元”互联形成神经网络。   5.4 决策树和规则推理   类似于一棵树的预测模型是决策树。在决策树中

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档