- 2
- 0
- 约4.33千字
- 约 7页
- 2016-10-06 发布于北京
- 举报
基于数据挖掘技术的图书馆个性化信息服务探讨.doc
基于数据挖掘技术的图书馆个性化信息服务探讨
关键词:图书馆;个性化信息服务;数据挖掘技术;关联规则
摘要:文章从数据挖掘技术的相关原理出发,构建了图书馆个性化信息服务系统,并对数据挖掘的实施过程进行了简要论述,并从关联规则的角度介绍了基于数据挖掘技术的图书馆个性化信息服务的实现途径。
中图分类号:G250.7文献标识码:A 文章编号:1003-1588(2016)02-0127-03
文献信息的检索与传播是图书馆的基础职能,随着图书馆数字化、智能化、自动化程度的不断提升,很多图书馆引入了中外文全文数据库。一方面满足了读者多样化的文献信息需求,另一方面也增加了读者在短时间内获取有效信息资源的难度[1]。个性化信息服务是图书馆“以人为本”价值理念的直接体现,是一种最大限度满足读者需求的主动性或智能推送性的服务模式,即通过对用户的借阅习惯和个性特点进行分析,进而主动地向用户提供其可能感兴趣的信息。这一服务模式涉及庞大的数据采集、处理、分析和归类,需要强有力的数据集成分析工具来支撑。数据挖掘又称知识发现过程,即利用关联规则从大量的、模糊的、不完全的信息数据库中提取潜在的、对读者而言有价值的信息。数据挖掘技术最先应用于商业领域,近几年已经开始引入图书馆管理与服务之中,其在图书馆个性化信息服务中的应用仍有较大的开发空间。
1基于数据挖掘的图书馆个性化信息服务系统设计
1.1整体结构模型
图书馆个性化信息服务涵盖了用户从网站注册到接受系统提供服务的全过程。这一系统首先对图书馆用户信息进行收集,而后关联技术对用户需求行为进行模型构建,继而用已存在的图书馆资源知识库与用户模型进行对照,提取出用户需求的具体信息服务(见图1)。
图书馆个性化信息服务系统分为两大基本模块,即在线推荐模块和离线挖掘模块,图中上半部分为在线推荐模块,下半部分为离线挖掘模块。知识资源库又细分为信息采集层、信息存储层、信息加工处理层、信息服务层等部分内容。其中,信息采集层、存储层和加工处理层满足了图书馆个性化信息服务中的强大数据需求,是数据挖掘的必要条件。系统数据采集通过搜集读者使用图书馆的信息而实现,如读者刷卡保留的借阅信息、个人身份信息等。待采集环节完成之后,由资源处理层对采集信息进行分类加工,更新知识数据库信息,确保数据资源的即时性(见图2)。
从图2可以看出,资源采集层实现信息采集有两种方式,即自动采集和人工采集。所谓自动采集指的是系统根据用户在图书馆中借书、还书、业务办理等刷卡记录自动提取并存储读者信息。人工采集是一种必要的辅助采集手段,某些情形下,因为系统的原因导致用户个人信息无法收录或收录不完全,如系统因功能故障未记录部分用户的身份信息,此时就需要依靠管理人员根据系统提示对用户信息进行完善补充。资源处理层除具备清理和分类信息功能之外,还具有把不规则数据转换为可识别数字信息的作用,最后经数据挖掘工具将其转化为统一识别的知识规则集,以实现个性化信息资源推送服务。
1.2工作流程
系统总体工作流程从用户和图书馆后台数据两方同时开展。首先,用户在图书馆个性化界面中注册信息并申请登录账号,实现与后台数据系统的实时交互。其次,用户通过登录认证查阅各类文献信息,同时点击接受图书馆个性化信息服务操作指令。个性化信息系统后台则根据已录入的用户信息,建立用户使用模型。最后,信息系统后台利用数据挖掘技术获取图书馆资源库中的关联资源,并向用户进行推荐(见图3)。
在线推荐模块为离线挖掘模块运行提供了数据支撑,而离线挖掘模块辅助在线推荐模块实现信息推送服务,两者共同组成了个性化信息服务模块,都不可缺少[2]。在线推荐模块在完成用户信息采集后,对信息进行整理归类,而后与系统知识库进行比对,最后根据关联规则生成用户所需要的信息。离线挖掘模块通过对用户进行的聚类细分找出相似用户群体,继而构建用户模型,完成个性化信息推送服务。
在线推荐模块的原理主要是把生成的用户模型与已有的资源知识库相比对,最终把有用信息推荐给用户。而采用离线挖掘,一方面要求在时间效度上具有科学性,另一方面要求在数据处理上具有即时性。图书馆个性化信息服务系统中存储的用户信息每时每刻都在更新,需耗费大量时间进行数据处理,考虑到在线处理会影响到用户的使用,通常情形下系统工作采用离线处理模式。因为离线数据挖掘基于用户使用信息生成关联规则,而在短时间内用户信息基数变化不大,所以离线处理的结果不会对个性化信息服务运行造成影响(见图4)。
图4离线数据挖掘生成关联规则流程图
从图4可以看出,这一关联规则流程主要由三部分模块组成:①数据处理模块。其又称数据存储模块,主要功能是依靠系统分析、处理和汇总图书馆资源数据库中的用户信息,而后将其
您可能关注的文档
最近下载
- 平凡的世界读书分享.ppt VIP
- 药物化学习题仉文升主编).pdf VIP
- 2025年山东济南高三一模数学试卷及答案.pdf VIP
- 2025年辽宁省委党校在职研究生招生考试(政治理论)历年参考题库含答案详解.docx VIP
- 保险双录标准话术.pptx
- 2025年辽宁省委党校在职研究生招生考试(法学)历年参考题库含答案详解.docx VIP
- 江苏省南通市2025年中考语文试卷(附答案解析).doc VIP
- 《人工智能在机械设计制造及其自动化中的实践》8900字.docx VIP
- 普传(POWTRAN)变频器PI500变频器使用说明书.pdf
- 最新部编版一年级数学下册教案(全册)表格式二次备课.doc VIP
原创力文档

文档评论(0)