关联规则挖掘在图书馆资源建设中的应用-计算机应用技术专业论文.docxVIP

关联规则挖掘在图书馆资源建设中的应用-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
答辩委员会成员名单● 答辩委员会成员名单 ● 姓名 工作单位 职称 备注 吴耿锋 上海大学 教授 主席 钱平 中国农科院 研究员 委员 何世钧 上海海洋大学 教授 委员 于庆梅 上海海洋大学 副教授 委员 郑永德 上海海洋大学 工程师 秘书 答辩地点 信息学院205 答辩日期 201 1/1/14 ◆ 上海海洋大学硕士学位论文关联规则挖掘在图书馆资源建设中的应用 上海海洋大学硕士学位论文 关联规则挖掘在图书馆资源建设中的应用 ● 摘 要 数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取 人们感兴趣的知识和规则的过程,数据挖掘的研究已经取得了重大的进展,而且 被应用到众多的领域。关联规则挖掘是数据挖掘研究中的一个重要课题,它主要 用于从给定的数据集中发现频繁出现的项集模式知识。由于最大频繁项目集中已 经隐含了所有频繁项目集,对同一个数据库来说,在相同的最小支持度下,发现 的最大频繁项目集的数量要远小于频繁项目集的数量,这就使计算的开销有很大 的降低,所以可以把发现频繁项目集的问题转化为发现最大频繁项目集的问题。 随着信息化时代的来临及网络和计算机应用的普及,‘图书馆每天产生大量的 图书流通数据,这些数据除了用于记录读者的信息外,一般只用来做一些常规的 ● 业务数据统计,这些数据潜在的使用价值还远远没能得到充分的挖掘和利用。因 此,我们可以通过将关联规则挖掘方法应用到图书数据的分析中,挖掘和发现出 借阅行为中隐含的规律,以指导图书馆的馆藏分布和图书采购决策,以及提供给 读者更人性化的服务等。 本文首先总结了数据挖掘的现状、图书馆资源建设的现状以及数据挖掘在图 书馆中的资源建设现状。接着介绍了数据挖掘的概念、过程、任务以及它的发展 趋势,深入学习和研究了关联规则挖掘的基本概念、性质、基本步骤和常用算法。 然后,重点对如何高效挖掘最大频繁项集进行了研究。在学习FP.tree的相关 理论及其构建过程的基础上,分析了目前比较经典的基于FP-tree的最大频繁项集 挖掘算法DMFIA。同时大胆尝试使用新手段和新思路,对关联规则的最大频繁项 集挖掘算法进行了探索,提出了一种基于FP-tree的新的最大频繁项集挖掘算法 DMH—B。举例分析了算法的思路,并通过实验模拟数据将DMFI B与DM咖行 比较,验证了算法DMFI_B在性能和效率上的优越性。 最后,设计和实现了图书馆数据挖掘系统。系统以上海海洋大学图书馆后台 数据库中2008年9月1日至2010年9月1日的借阅的流通日志为数据来源。先经过数 据预处理过程,包括数据选取、数据清理、数据转换,再经过数据挖掘,采用DMFI B 算法实现了对图书馆读者借阅数据的挖掘,找出关联规则。最后对挖掘出来的结 上海海洋大学硕士学位论文果进行了分析和评价,结果表明,本文的研究与设计为图书馆图书采购、排架以 上海海洋大学硕士学位论文 果进行了分析和评价,结果表明,本文的研究与设计为图书馆图书采购、排架以 及信息服务提供了一个科学决策的有效方法。 关键词:数据挖掘,关联规则,最大频繁项目集,DMFI_B算法,图书馆 ◆ ● n 上海海洋大学硕士学位论文The 上海海洋大学硕士学位论文 The Application ofAssociation Rules Mining in Library Resources Construction ◆ Data mining is the process of extracting the useful knowledge and rules from the huge,incomplete,yawp,fuzzy and random data.It has got the major progress and has been applied in many fields.Association mles mining is one important research area of data mining,its goal is to discover itemset pattern knowledge which frequently appears from given large databases.As the maximal frequent itemsets have implied all the frequent itemsets,for the same database,the number of maximal frequent itemsets which are found is far less than frequent

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档