数据挖掘在高校图书馆的应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在高校图书馆的应用

数据挖掘在高校图书馆的应用 数据挖掘在高校图书馆的应用 石军 摘要概述了数据挖掘的一般知识和几种在信息管理领域有应用前景的数据挖掘软件, 探讨了数据挖掘在高校图书馆信息管 理与服务方面的应用, 分析了数据挖掘在应用中存在的问题。 关键词数据挖掘知识发现高校图书馆 Application of Data Mining to Academic Libr ary Shi Jun Abstr act The paper introduces the knowedge of Data Mining and several kinds of Data Mining software, and discusses the application and some problems of Data Mining in the Academic Library. Keywords Data Mining, KDD, Academic Library ·数字图书馆· 数据挖掘是当前数据库研究、开发和应用最活跃的分支之 一, 它在科学发现、商业零售以及信用管理、医学等领域已得到广 泛应用。随着高校图书馆自动化程度与数字图书馆建设的不断发 展, 图书馆要处理和提供的信息越来越多, 越来越复杂。图书馆如 何运用这一新技术挖掘丰富的信息资源, 为服务读者和科学管理 提供可靠的依据, 值得图书馆界深入研究。本文试图重点探讨数 据挖掘在高校图书馆信息管理与服务方面的应用。 1 数据挖掘的定义与方法 数据挖掘(Data Mining, DM) 也称知识发现(Knowledge Discovery from Database, KDD) , 是从大量的、不完全的、先前不 知道的、模糊的、可能有污染的随机详细数据中提取隐含的、潜在 有用的信息和知识的过程。挖掘的对象是数据库和数据仓库, 旨 在通过对数据的统计、分析、综合、归纳和推理, 揭示事件间的相 互关系, 预测未来的发展趋势, 起到辅助实际工作问题求解的作 用。获取的知识表示为概念、规则、规律、模式等形式, 可用于信息 管理、决策支持和过程控制。 严格来讲, 数据挖掘是知识发现过程的一个基本步骤, 是最 重要的部分。 整个知识发现过程由若干挖掘步骤组成: ( 1) 数据选择。根据挖掘要求, 将多个数据库中的数据进行 合并处理, 提取与KDD 相关的数据, KDD 将主要从这些数据中 进行数据提取。 ( 2) 数据预处理与转换。从与KDD 相关的数据集合中除去明 显错误的数据和冗余的数据, 进一步精减所选数据中的有用部 分, 缩小处理范围, 提高数据分析质量。并将数据转换成为规范形 式, 以使数据挖掘更有效。 ( 3) 数据挖掘。就是选择合适的挖掘算法, 对数据进行分析, 以得出真正合理有用的知识。 ( 4) 知识描述。根据数据挖掘的目的对提取的信息进行分析, 把有价值的信息挑选出来, 将发现的知识以用户能理解的方式提 供给用户。 ( 5) 知识评价。用户根据已有的知识对挖掘的结果进行合理 性分析, 若有不合理的方面, 再重复上述步骤, 以保证挖掘结果的 合理性。 数据挖掘不仅能对过去的数据进行查询, 并且能够对将来的 趋势和行为进行预测并自动探测以前未发现的模式, 从而很好地 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 92 !!!!!!!!!!!!!!!江西图书馆学刊( JLSJ) 第35 卷第3 期(Vol.35 No.3) 支持人们的决策。数据挖掘主要有以下五类功能: 自动预测趋势 和行为、关联分析、聚类、概念描述、偏差检测。用于数据挖掘的方 法包括归纳法、神经网络、相关分析、模糊逻辑、统计分析、遗传算 法、决策树方法和可视化技术等。各种技术方法都有其特点与不 足, 以及现有的和潜在的应用范围和应用领域。 在解决问题时, 可使用以下几种手段: 预测模型、数据库分 析、链元分析和编差检测。 ① 预测模型: 在联机分析处理(OLAP) 中使用演绎推理, 在 数据挖掘中使用归纳推理。 ② 数据库分析: 把数据库自动划分为聚类( 簇) 。 ③ 链元分析: 基于对横向关联和顺序关联的发现, 且对记录 间联接进行确证。 ④ 偏差检测: 对记录不能被归入到特定格元现象的侦知和 解释。 实际应用时可以交叉更替使用各种算法以挖掘更多的信息。 2 数据挖掘在图书馆的应用 图书馆日常工作中每天都会产生大量的统计数据, 如果没有 一个强有力的数据采集和处理工具介入, 往往会变成“数据坟 墓”, 失去其对图书馆业务工作的指导作用。而数据挖掘就是这样 一种新兴的技术, 可以为图书馆工作提供技术支持和决策管理支 持。 2.1 分析读者需求, 优化信息资源建设 高校图书馆的文献采

您可能关注的文档

文档评论(0)

ah82299 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档