- 62
- 0
- 约4.55千字
- 约 8页
- 2023-01-17 发布于广东
- 举报
图书馆用户行为数据挖掘分析与应用
乔 婷(中国消防救援学院,北京 102202)随着云计算技术、大数据技术和各种传感器技术的迅猛发展,图书馆数据中心的基础设施架构及用户服务模式发生了根本性改变,数据资源已经成为图书馆信息系统重要的组成部分和图书馆服务能力的重要保障因素。如何高效利用大数据资源对用户需求、用户信息行为、用户社会关系、图书馆服务方法和图书馆业务模式进行准确感知和识别,是图书馆提高对用户需求的洞察力以及改善用户阅读体验的前提,也是图书馆开展用户精准的个性化服务和提高自身的服务竞争力的有力保证。1 图书馆用户行为数据分析的意义随着网络信息技术的发展,图书馆的用户服务模式与服务能力的评估标准有了根本性的变革,用户服务能力的建设重点已由以资源建设为核心,向以满足用户需求为中心的个性化服务能力建设转变。因此,图书馆在用户服务过程中,能否全面准确掌握用户的信息行为、信息获取的社会关系、信息需求和信息获取方式变化趋势等数据,已成为图书馆个性化服务安全、高效、准确和经济开展的关键。图书馆的服务价值来源于对用户需求的实现。认知科学研究发现,用户是书馆服务的主体,图书馆仅仅是用户信息活动的外在工具之一,是用户信息需求在物理或现实世界的延伸[1];而用户信息需求过程是一种“以我为主”的自组织过程,有着内在的秩序,并独立于图书馆而存在。因而,图书馆管理者不应以专家自居,而应重视用户需求的内在规律性。图书馆具有不同的用户主体,而他们工作及学习的领域、身份、年龄等差异使他们对资源有着不同的需求及偏好[1]。把所有用户的行为转化为可度量的数据,并对原本难以捉摸的用户信息行为活动及其关系进行分析、描述、和预测,获取到的新知识,对图书馆在管理方面进一步改进服务决策、提升服务能力具有指导性意义。2 图书馆用户行为数据的定义及获取图书馆用户行为是指为获取图书馆信息资源而受思想支配而施行的一切活动。科学高效采集用户行为数据,是分析用户信息行为需求模式,提高图书馆用户服务满意度的关键。根据用户资源获取方式的不同,用户数据行为可以分为纸质资源的获取和电子资源的获取。纸质资源获取方面主要涉及用户基本信息、OPAC检索记录、馆藏书目、流通历史记录;电子资源获取主要涉及读者对网站及移动客户端中数字资源的访问,具体包含用户基本信息、数字资源类型、名称、访问利用方式及所利用详细电子资源的归属分类。另外,根据用户需求还应包括用户信息咨询方面,具体包括用户线上线下的业务咨询、意见建议、纸质及电子资源荐购等方面[2]。3 图书馆用户行为数据的处理图书馆用户行为数据的获取渠道多样,从不同的数据库表中获取的数据包含大量的冗余和噪声,并且不同数据表中的字段格式各不相同,因此必须对采集到的数据进行数据清洗、转换集成、数据装入等工作[3]。3.1 用户行为数据清洗用户行为数据清洗是指对采集到的用户行为数据进行处理,核实数据的完备性,过滤掉和用户行为分析没有关联的垃圾数据,以减少数据冗余和噪音对用户行为分析的不良影响。随着对户行为探索的进一步加深,用户信息行为数据的采集范围和采集深度不断增长,这些被采集的用户行为数据中包含许多数据噪音。如果数据库中这些不良数据一直存在,会对数据分析的结果造成影响,降低用户信息行为数据的可用性和价值密度。数据清洗过程通过技术和手动操作相结进行,主要有对拼写错误的更正,对缺失数据值的补充,对不同的系统中的重复数据进行处理、删除噪声数据。3.2 用户行为数据转换集成由于用户行为分析的数据获取来自不同的数据库、数据表,这些数据可能会有不同的数据存储格式与类型,因此需要对某些数据表中存储的数据字段类型进行修改,实现数据字段格式、类型的统一,以便数据挖掘过程的顺利进行。数据转换的目的是将收集抽取到的不同结构的数据转换成集成的、统一标准的数据,形成一个集成的统一标准的数据集合。另外,在首次装入数据后,还需实时监测数据源的变化,将更新的所需数据加载到数据仓库中。3.3 图书馆用户行为数据挖掘分析的模型3.3.1 聚类模式聚类分析模式是利用对象的不同特征,根据对象的相似性,将数据分为不同的分类的集合[2]。不同分类中的对象差别较大,而同一个类中的对象具有高度的相似性。例如,根据图书馆的用户身份不同可以分为学生类、教员类、带队干部类、教辅员类。可以通过对图书馆的用户属性进行分类来研究用户的行为习惯,如年龄、身份、专业、籍贯等,通过对用户行为数据的聚类分析,从而找出对象与对象、对象与各属性之间的关系,从而分析并获得用户的行为知识。3.3.2 关联规则关联规则是用来描述数据库中不同数据项之间存在的关系规则,可以根据一个对象中某些属性的出现推导出另一些属性也会属于这个对象[3]。通过关联规则可以从海量数据中发现存在于数据中的隐藏的一些关联
您可能关注的文档
- 防止耕地“非农化”“非粮化”背景下受污染耕地风险管控对策探讨.docx
- 如何组织刺槐蜜的采集.docx
- 初中音乐教学中学生审美能力的培养策略.docx
- 猪群发生疾病的特点以及综合防疫方法.docx
- 诗人阿垅:时代风暴中的“白色花”.docx
- 产儿科住院医师整合培养模式探讨.docx
- 浅谈重庆传统风貌区的发展困境与对策.docx
- 用激情来干事创业.docx
- 数字经济背景下平台封禁行为规制路径研究.docx
- 存量规划视角下城镇低效用地再开发策略研究.docx
- 汽车设备采购供应合同协议.docx
- 《企业财务会计》教案-教学设计 8.3.1 任务三 无形资产后续计量业务核算与应用1.docx
- 办公室搬迁合同协议书.docx
- 《企业财务会计》教案-教学设计 8.3.2 任务三 无形资产后续计量业务核算与应用2.docx
- 2026年土木工程质量问题的成因及对策.pptx
- 培训服务合同协议.docx
- 委托合同模板(2025年)技术转移合同.docx
- 《企业财务会计》教案-教学设计 7.3.1 任务三 固定资产后续计量业务核算与应用1.docx
- 2025年线上教育平台师资培训合同.docx
- 《企业财务会计》教案-教学设计 7.2.1 任务二 固定资产初始计量业务核算与应用1.docx
原创力文档

文档评论(0)