网络环境下数据挖掘技术在图书馆信息服务中应用.docVIP

下载本文档

2
0
约4.37千字
约 9页
2018-09-18 发布于福建
举报
版权申诉

网络环境下数据挖掘技术在图书馆信息服务中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

网络环境下数据挖掘技术在图书馆信息服务中应用

网络环境下数据挖掘技术在图书馆信息服务中应用　　[摘要]数据挖掘是一门新兴的数据分析技术，当数据挖掘技术应用于网络环境下的WEB中就成为WEB挖掘。数据挖掘技术对图书馆业务工作的支持主要体现在信息咨询、信息个性化服务等方面。在网络环境下，数字图书馆中图书馆员必须掌握这种数据挖掘技术才能更好地为信息需求者提供有效快捷的信息服务。　　[关键词]数据挖掘；WEB；INTERNET；信息服务　　[中图分类号]G250.76　[文献标识码]A　[文章编号]1673―5595(2007)02-0076―(03) 　　　　随着信息技术的高速发展，数据库应用的规模、范围和深度不断地扩大，已经从点(单机)发展到面(网络)，甚至到Internet全球信息系统，使得无论是商业企业、科研机构还是政府部门，在过去若干年的时间里都积累了海量的数据资料。由于这些资料十分繁杂，仅仅依靠数据库的查询检索机制和统计学方法已经远远不能满足现实需要，所以迫切需要有效的信息分析工具，才能从大量数据库中抽取有用的信息和知识。数据挖掘正是为迎合这种需要而产生并迅速发展起来的用于开发信息资源的一种新的数据处理技术。　　数据挖掘(DataMining)是信息技术领域中最热门的话题之一，“数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程”。数据挖掘把对数据的低层次简单查询，上升到从数据中挖掘知识、提供决策支持的高度，形成了新的技术热点。要性　　　　一、图书馆信息服务中应用数据挖掘技术的必要性　　　　WEB是一个非常成功的信息系统，这个系统为信息在全球范围发布和传播提供了机会，它允许任何人在任何地点、任何时间传播和获取信息。但是，大量信息在给人们带来方便的同时也带来了许多问题：信息过量、难以消化，信息真假难以辨识，信息安全难以保证，信息形式不一致、难以统一处理。在信息的海洋中，即使最先进的搜索引擎也只能从1/3可以索引的WEB站点中获取信息。人们开始提出一个新的口号：“要学会抛弃信息。”人们开始考虑“如何才能不被信息淹没，而且从中及时发现有用的知识、提高信息利用率”。事实上，作为一个非专业的信息管理人员，要从茫茫的信息海洋中获取本专业最新、最权威的知识和较为全面的信息，并从中得到有用的知识几乎变得不可能。要知道，各高等院校或研究所里的专家教授们由于研究课题计划的紧迫，他们急需本专业领域最新最权威的知识和信息，他们没有时间在成千上万的站点中的数不清的页面中查找所需的信息，所以在信息的提供者与信息的消费者之间应有一个中间环节，通过这个环节，信息消费者能够快捷方便地得到想要的信息，正是这种迫切需要为图书馆员提供了展现才华的机会，图书馆员可以运用信息管理技能直接为用户提供有用信息。　　由于WEB技术的巨大成功，人们越来越多地依靠INTERNET来获取知识、信息。显然，人们到图书馆的次数和时间已越来越少，总有一天，人们再也不会亲自跑到图书馆去借一本书或咨询某个问题。面临着如此巨大的挑战，从事图书馆工作的人们提出了数字图书馆的设想，并且经过艰苦的研究已成功地建立了数字图书馆。数字图书馆是一个标准的电子信息基础设施，它采用分布数据存储，用户可以通过各种链接和操作在一个较大的地域范围内搜索和检索出自己所需的信息，而且整个操作对用户是开放的。也就是说，数字图书馆能够把数据存储在多个站点中，用户只需一个简单的操作就可从这些站点中搜索信息。数字图书馆是传统图书馆在信息时代的发展，它不但具备了传统图书馆的功能，而且还提供综合的信息访问服务。人们希望，数字图书馆将成为未来图书馆的信息中心和枢纽。　　在网络环境下的数字图书馆中，图书馆员是信息专家，他们是信息组织者、信息生产者、信息服务者和信息管理者。正是图书馆员的信息服务活动使得数字图书馆有别于其他信息站点。图书馆员必须选取某个工具来有效地组织和获取WWW中的信息。传统的搜索引擎根本不评估站点的内容，而只是机械地识别WEB设计者提供的关键字，即使是最优秀的搜索引擎也需要用户亲自访问到不同的站点并对信息加以验证。在网络环境下，数据挖掘技术是克服这些缺点的最理想而又必需的工具。　　　　二、图书馆信息服务中的数据挖掘技术　　　　何为知识?从广义上理解，数据、信息也是知识的表现形式，但是人们习惯于把概念、规则、模式、规律等看作知识。人们把数据看作是形成知识的源泉，好像从矿石中采矿或淘金一样。原始数据可以是结构化的，如关系数据库中的数据；也可以是半结构化的，如文本、图形和图像数据；甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的，也可以是非数学的；可以是演绎的，也可以是归纳的。发现的知识可以被用于信息管理，查