数据挖掘技术在图书馆领域的应用沙泓薇.docVIP

数据挖掘技术在图书馆领域的应用沙泓薇.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在图书馆领域的应用沙泓薇.doc

数据挖掘技术在图书馆领域的应用沙泓薇 时代经贸2010耳4月中旬刊总第166期 数据挖掘技术在图书馆领域的应用沙泓薇 沙泓薇 (鸡西市图书馆,黑龙江鸡西158100) 【摘要】本文介绍了数据挖掘的定义,功能及常用技术方法,简要介绍了数据挖掘技术在图书馆领域的应用. 【关键词】数据挖掘;数据挖掘技术;图书馆? 随着信息技术的不断发展,图书馆的馆藏内容以及服务对 象,范围,深度都发生了深刻变革,图书馆的角色也从单一的 为读者提供书籍转化为知识,信息的提供者.图书馆传统的服 务已经不能满足读者的需求,读者期望图书馆根据其各自不同 的需求,提供个性化,网络化,集成化的信息服务.图书馆要 适应这一变化,引入信息技术,改进服务的方式,手段,帮助 读者在海量的信息中找到有用的知识,真正提高图书馆的工作 效率,实现全社会的信息资源共享.数据挖掘技术正是高校图 书馆实现智能转变的应用技术之一. 1.数据挖掘技术简介 l_1数据挖掘的定义 数据挖掘(DataMining)是信息技术领域中最热门的话 题之一.数据挖掘就是从大量的,不完全的,有噪声的,模糊 的,随机的实际应用数据中提取隐含在其中的,人们事先不知 道,但又是潜在有用的信息和知识的过程.从广义上理解,数 据,信息也是知识的表现形式,但是人们通常把概念,规则, 模式,规律等看作知识,而把数据看作是形成知识的源泉.原 始数据可以是结构化的,如关系数据库中的数据;也可以是半 结构化的,如文本,图形和图像数据;甚至是分布在网络上的 异构型数据.发现知识的方法可以是数学的,也可以是非数学 的;可以是演绎的,也可以是归纳的.发现的知识可以被用于 信息管理,查询优化,决策支持和过程控制等,还可以用于数 据自身的维护.因此,数据挖掘是一门交叉学科,它把人们对 数据的应用从低层次的简单查询提升到从数据中挖掘知识,汇 聚了不同领域的研究者,尤其是数据库技术,人工智能技术, 数理统计,可视化技术,并行计算等方面的学者和工程技术人 员,投身到数据挖掘这一新兴的研究领域,形成新的技术热 点.数据挖掘是知识发现过程的一个步骤.该步骤可以与用户 或知识库交互,以有趣的模式提供给用户,或作为新的知识存 放在知识库中.因此,数据挖掘是整个知识发现过程中最为重 要的一步,它能发现隐藏的模式.数据挖掘是一种新的信息处 理技术,其主要特点是对各种商业数据库中的大量业务数据进 行抽取,转换,分析和其他模型化处理,从中提取辅助决策的 关键性数据.种种迹象表明,数据挖掘这一研究领域的发展充 满了机遇和挑战. I.2数据挖掘的功能和常用技术方法 数据挖掘功能用于指定数据挖掘任务中要找的模式类型. 通过预测未来趋势及行为,做出前瞻性,基于知识的决策.数 据挖掘主要有以下5种功能:a.自动预测趋势和行为.以往需要 进行大量手工分析,如今通过数据挖掘自动在大型数据库中寻 找预测性的信息可以迅速得出结论.b.关联分析.关联分析发 现关联规则,这些规则展示属性一值频繁地在给定数据集中一 起出现的条件.关联分析广泛用于购物篮或事物的数据分析. 其可分为简单关联,时序关联,因果关联3种.C.聚类.聚类 分析数据对象,而不考虑已知的类标记,是描述和偏差分析的 先决条件.聚类技术主要包括传统的模式识别方法和数学分类 学.d.概念描述.概念描述就是对某类对象的内涵进行描述并 概括这类对象的有关特征.概念描述由特征化和比较(或区分) 组成.概念特征化是基于属性或维的概化方法,通常使用基于 数据立方体OLAP方法和面向属性归纳的方法.概念比较可以用 类似于概念特征化的方法,量化地比较和对比从目标类和对比 类概化的元组.e.偏差检测.用来检测数据库中的异常记录. 针对中小型行业企业在IT整合方面的问题,一些国内外知 名厂商展开了全面技术合作,在Java基础上推出了面向业务的 体系架构BOA(BusinessOrientedArchitecture),为中小行业 企业的信息整合提出了解决方案——B0A.BOA,顾名思义,就是 Business+SOA.简单地讲,可理解为在SOA技术的基础之上融入行 业经验,利用传统技术和SOA技术来实现对业务系统通用构件的对 接,部署,使得SOA与行业个性化应用得以融合.相比S0A,BOA架 构整合了大量的本土企业用户的应用经验,使得软件的开发,部 署更加贴近国内中小企业的个性,通用化需求,能更好地满足中 国日益膨胀的行业支撑平台的需求,成为解决IT整合,面向 服务架构的一个新主流.结合SaaS的主要特点及在企业信息化中 的初步应用实践,在此基础上BOA如果与SaaS相结合可以为中小企 业信息化提供了一个比较切合实际的实现思路. 3.2.2sa§S对中小企业信息化的影响 SaaS(软件即服务)的应用为中小企业信息化提供了更为 有

文档评论(0)

gdkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档