基于数据挖掘的农业高校图书馆借阅数据分析研究农业信息化专业论文.docxVIP

基于数据挖掘的农业高校图书馆借阅数据分析研究农业信息化专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目 录 1 引言 1 1.1 选题的背景与意义 1 1.1.1 选题的背景 1 1.1.2 选题的意义 2 1.2 数据挖掘技术在图书馆领域的研究概况 2 1.2.1 数据挖掘技术在国外图书馆的研究概况 3 1.2.2 数据挖掘技术在国内图书馆的研究概况 3 1.3 本文的研究目的、研究方法和创新点 5 1.4 本文的组织结构 5 1.5 本章小结 6 2 数据挖掘概述 7 2.1 数据挖掘的概念 7 2.2 数据挖掘的功能 7 2.3 数据挖掘的过程 8 2.4 常用的数据挖掘技术 9 2.5 常用的数据挖掘算法 10 2.5.1 聚类规则及算法 10 2.5.2 关联规则及算法 13 2.6 数据挖掘工具 15 2.7 本章小结 16 3 数据准备 17 3.1 图书馆自动化系统简介 17 3.2 图书馆图书分类法简介 17 3.3 数据选取 17 3.4 数据预处理 19 3.5 本章小结 20 4 基于统计的数据挖掘 21 4.1 基于时间统计的数据挖掘 21 4.2 基于读者统计的数据挖掘 22 4.3 基于图书类别统计的数据挖掘 24 4.4 基于聚类的数据挖掘 26 4.4.1 读者聚类数据挖掘 26 4.4.2 图书聚类数据挖掘 30 4.5 本章小结 31 5 基于关联知识的数据挖掘 33 5.1 基于关联分析的图书馆借阅数据预处理 33 5.2 图书大类之间的关联分析 35 5.3 读者单位与图书大类之间的关联分析 37 5.4 不同读者类型与图书大类之间的关联分析 38 5.5 不同图书之间的关联分析 39 5.6 本章小结 42 6 结束语 43 6.1 总结 43 6.2 建议 43 6.3 展望 46 参考文献 47 基于 基于数据挖掘的农业高校图书馆借阅数据分析研究 河北 河北农业大学硕士学位论文 PAGE PAGE 11 PAGE PAGE 10 1 引言 1.1 选题的背景与意义 选题的背景 随着计算机技术的发展,人类正在步入一个“信息爆炸”的时代,人类对数据的 存储已远远超过以往的任何一个时代,数据库的容量规模已经达到上万亿字节的水 平,过量的信息所带来的负面效应就是被信息淹没却饥渴于知识,在这个时代人们面 临的主要问题不再是缺乏足够的信息可以使用,而是面对数据的汪洋如何有效地利用 它,人们急需解决数据丰富性与知识贫乏性之间的矛盾,正是在这种背景下数据挖掘 技术应运而生并显示出强大的生命力。 数据挖掘是一种知识发现的过程,它基于统计学、人工智能、机器学习等技术高 度自动化地分析数据并做出归纳性的推理,从中挖掘出潜在的知识,这些知识能够帮 助决策者对未来情形进行预测和风险评估,并做出正确的决策。它之所以越来越多的 受到人们的重视,原因在于其对海量数据的分析能力,能够满足人们对数据的更深入 的需求。它不仅能让人们对数据的理解能力得到提高,并且还可以透过数据而获得更 多有用的知识[1]。 由于数据挖掘从一开始就是面向应用的,因此自产生以来,已被广泛应用于生物、 金融、零售、电信、科学研究、产品控制等多个领域,如在科学实验中,Fayyad 和 他的同事们在加利福尼亚 Pasadena 的 Jetpropulsion 实验室,应用决策树和基于规则的 方法发现了一批新的类星体;在零售行业中,货篮分析帮助商店确定货架布局以促进 销售;在金融领域中,孤立点的发现用于预测和预防可疑信用卡交易、恶意透支等; 在销售行业中,通过在 CRM 中应用,提高销售的成功率;在制造业中,用来控制产 品生产,降低次品率[2]。 数据挖掘技术是一门极具发展前景、备受推崇的新兴技术。据 2010 年 Gartner Group 的一次高级技术调查结果显示,“未来 3~5 年内将对工业产生深远影响的 5 大关键技术”之首的是数据挖掘和人工智能,“未来 5 年内投资焦点的 10 大新兴技 术”前两位是并行处理体系和数据挖掘;麻省理工学院的《科技回顾》公布“改变未 来的 10 项新兴科技趋势”之一是数据挖掘;美国国家科学基金会的数据库研究项目 中,数据挖掘被列为最有价值的项目[3]。 20 世纪 90 年代初,我国图书馆事业的发展开始进入自动化阶段,各种自动化集 成管理系统的使用,使采访、编目、典藏、流通、检索等工作实现了自动化管理。图 书馆自动化系统每天都会产生大量的有关读者利用图书馆的数据,这些数据中蕴含着 丰富的、有用的知识和信息,如:哪些图书频繁地被借阅,读者利用图书馆具有哪些 相同规律,读者个体的阅读行为特点、偏好、个性,不同的读者与图书间的潜在关联 以及不同学科间的内在联系等,这些知识和信息对图书馆的各项决策管理起

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档