- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Clementine图书馆用户借阅行为挖掘探究
基于Clementine图书馆用户借阅行为挖掘探究 [摘 要] 本文利用Clementine软件和数据挖掘技术,对高校学生的借阅记录进行分析并挖掘建模,最后挖掘得到更深层次的数据,从而为图书馆管理者提供决策依据,帮助完善高校图书馆的服务功能
[关键词] 借阅行为;数据挖掘;Clementine
[中图分类号] TP311 [文献标识码] A [文章编号] 1671-0037(2017)3-79-3
Mining Study of the Library Users Borrowing Behavior based on Clementine
Hou Songxia
(Tianjin Transportation Vocational College, Tianjin 300112)
Abstract: This article analyzes the college students’ borrowing records and mines to establish models using Clementine software and data mining technology. The deep data obtained after final mining guides the decision of library’s manager, and helps complete the service function of colleges’ library.
Key words: borrowing behavior; data mining; Clementine
1 引言
随着网络和计算机数据库技术的飞速发展和在各个领域的广泛应用,现代图书馆正在向着信息化和数字化的方向转变。近些年来,我国加大了对图书馆的投资力度,图书馆的数据库不断更新、存储设备不断扩大,网络环境进一步优化、服务器更加强大。在这种环境下,利用数据挖掘技术可以更好地对图书馆资源进行重组、汇集、抽取和预测;能够更方便快捷地从互联网上采集和转换信息和数据,为图书馆发展提供更好的决策支持,为读者提供个性化服??[1]。数据挖掘技术可以指导图书信息资源的采集。我们可以对图书借阅记录进行数据挖掘,其后能够得到读者借阅图书的使用频率表,然后再对读者进行分类,同时对适合不同类别的读者的图书资源进行聚类,从而快速准确地获得订书目录。馆藏图书数据库(OPAC系统)是图书馆纸质文献资料数据的存储系统,编目员每天对它进行维护,并及时输入各种图书的数据。如果对这些数据进行挖掘可以有针对性地制定馆藏策略,有目的地决策图书馆的建设方向
2 图书馆流通数据分析与清洗
2.1 流通数据结构
目前图书馆系统主要有四种数据挖掘模式[2]:①关联规则模式:关联规则模式的数据挖掘过程包括两个环节:一是在大量的信息中找出高频项目;二是通过分析这些高频项目发现其中的关联规则。②聚类模式:聚类模式的作用手段是将分析对象划分成相对同质的组群来进行统计分析,又称为数值分类或者是分类分析,它是基于数据的相似性来收集和分类数据的。③决策树模式:决策树模式属于分类方法中很有代表性的一种。它是基于离散函数值的逼近方法。决策树过程包括两个阶段:一是处理数据,根据归纳算法产生规则以及决策树;二是根据生产的规则和决策树来分析新数据。④贝叶斯模式:贝叶斯模式属于一种统计学方法,它是利用概率统计的方法来进行数据的分类。这种方法使用简单、分类迅速、准确率高,应用比较广泛
图书馆借阅的基本业务数据[3]包括:读者证号、读者姓名、流通日期、读者条码、图书条码、题目、索书号等等。接下来将通过数据挖掘分析探究不同的读者借阅的图书类型之间有什么关联,借阅的行为是否有一定的规律,能否根据规律制定一些针对性的服务
2.2 预处理
根据需要,从数据库中抽取书目信息表(biblios,对应的是图书馆每一种图书的marc信息),图书信息表(holding表),图书借还记录表(LOG_CIR),读者信息(READER)。分别对每个表进行预处理删减掉无用项目
3 挖掘过程
3.1 建立数据源视图
在clementine中[4],建立数据源是挖掘服务器与数据库建立了访问链路,建立数据源视图是选取了数据库中相关表、字段[5]
Biblios表对应的是图书馆每一种图书的Marc信息,holding表对应图书馆每一册馆藏图书的信息,与biblios表通过bookrecno字段关联,log-cir表对应图书借还记录表,通过读者条码data2字段和图书馆条码data3字段分别和reader表rdid字段、holding表barcode字段关联
您可能关注的文档
最近下载
- TB-T 2491-1994 扣件组装疲劳试验方法.pdf VIP
- 短节段融合内固定治疗成人退变性脊柱侧凸并发症-中国骨与关节杂志.pdf VIP
- 2025年银行纪检笔试题目及答案.doc VIP
- 《企业经营决策讲义》课件.ppt VIP
- 中小学生牛奶配送项目 投标方案.docx
- 2024年贵州省黔东南苗族侗族自治州凯里市鸭塘镇招聘社区工作者真题及参考答案详解.docx VIP
- 样板工程验收记录.docx
- YY_T 0466.1-2023 医疗器械 用于制造商提供信息的符号 第1部分通用要求.pdf
- 七年级数学新课标下的单元教学设计实践研究.docx VIP
- 燃气发生器结构和系统详解.ppt VIP
文档评论(0)