- 2
- 0
- 约3.6千字
- 约 8页
- 2023-08-15 发布于浙江
- 举报
?
?
协同过滤算法在高校图书馆个性化推荐中的应用研究
?
?
袁瑰霞
(安阳师范学院 图书馆,河南 安阳 455000)
0 引言
近年来,我国科学技术发展迅猛,高校图书馆开始引入信息化技术,发挥馆藏丰富的书籍资源作用,使教师用户和学生用户的整体知识素养得到有效的提升[1]。用户通常通过信息检索寻找符合自己需要以及喜好的书籍资源,但信息检索的步骤较为烦琐,许多用户需要经过多次的Key检索才能寻找到适合的资源,因此,许多高校图书馆在高校图书馆系统中引入信息推送模块[2]。高校图书馆通过对各用户的检索记录和借阅记录进行整理,分析用户行为数据,根据各用户的资源点击情况对图书馆资源进行分类与排序,制定推荐榜单[3]。许多热门书籍资源不断引进,高校图书馆还会将新进资源进行推荐,但许多高校图书馆还不能实现对最新的资源自动推荐,使用户不能及时了解高校图书馆新进资源的更新情况,同时,高校图书馆的书籍资源推荐方法还不够完善,本文研究基于协同滤波算法为提高高校图书馆的服务水平提供参考依据,对提高高校图书馆的个性化推荐效果具有重要的现实意义。
1 协同过滤算法在高校图书馆个性化推荐中的应用
1.1 用户信息数据获取与显示
本文用户信息数据来源于某高校图书馆的真实数据,主要包括学生注册基本信息,后台借阅记录以及学习行为数据。获取学生基础数据是进行高校图书馆个性化推荐的信息基础,本文首先通过不同用户对图书资源的打分和点赞,分析不同用户的资源需求和图书偏好,再通过数据支持模块建立与知识库和显示终端的联系,实现个性化推荐。本文数据共有6 820名学生,涉及395 876本图书,134 571条借阅记录。在学生的后台借阅记录中,包括借还书信息,借阅方式以及图书信息。将高校图书馆中的各类信息进行整合,这些信息中存在着大量对个性化推荐结果不会产生影响的数据。因此,对该类信息的冗余数据进行相应的剔除,只保留几条基础信息数据。若数据中存在关键信息的缺失,则需要对该数据进行补充,如索书号、借还时间以及用户证号等。对获取的数据进行整理,若存在不完整的数据则需要进行补全修正,在数据检查中发现近3年来存在此类情况的数据较少,为了避免后文进行数据处理时所产生的较大误差,因此本文选取近3年的数据来研究用户行为。
1.2 基于协同过滤处理数据
本文对于高校图书馆的数据集处理主要包括数据变化以及隐式数据的转化。隐式数据表现着用户与图书馆的浏览、借阅等互动行为,由于隐式数据不能直接反映出学生对于不同类型图书资源的偏好,以及对书籍资源的喜好程度,只能从某类别的书籍借阅记录中获取用户的偏好,并根据该类型图书资源的;浏览与借阅次数好数量,判断用户对该类别书籍的喜好程度。本文基于协同过滤算法,将用户借阅记录的隐式反馈转化对图书资源类别的显式评分,通过数据变化解决高校图书馆数据稀疏问题。本文将书籍类别进行进一步细分,将书目分为若干大类,根据用户借阅图书的隐私反馈转化为对书目类别的兴趣评分,以用户的书目类别兴趣的变换数据衡量用户对某类图书资源的兴趣,进行兴趣预测评分,具体公式为:
式中:xi为该类书籍的借阅数量,λ和γ分别为用户和书籍的相关系数,兴趣度与书籍借阅的数量成正相关关系,但增加幅度会逐渐减小。在兴趣度中,认为借阅数量为5本的用户兴趣度明显高于借阅数量为2本的用户,但借阅数量为12本和15本的兴趣度差异不大。在隐式评分转化后,构建用户与书籍类别的评分矩阵为:
矩阵中Rnj为第n个用户对第j个书籍类别的兴趣预测评分,在兴趣评分计算完成后,便实现了显性评分矩阵的构建,完成了数据转换。
1.3 用户与图书相似度定义及描述
用户与图书的相似度定义及描述需要对用户和图书的相似度进行分别计算,本文采用内积法进行图书相似度的计算,分别表示不同图书的Key和对应的权重,将各类图书的不同Key信息构成向量空间。选取相似的两本图书进行相似度的计算,查询这两本图书的相同Key,并根据相同Key形成新的向量信息,计算图书向量的相似度。设两本书共有m个共同Key,根据两本书的对应的不同向量进行计算,具体公式为:
其中两本书分别表示为Wa和Wb,Bak和Bbk分别代表两本书对应的向量,k为图书的Key,B为Key对应的权重。其用户相似度线性加权公式为:
式中:SIMnum和SIMt分别为用户的数值型属性相似度和文本型属性相似度,SIMact为用户活跃相似度。用户与图书的相似度定义及描述通过比对用户动态信息表和图书Key信息,列出相同Key,记录Key出现的频率,使用上文相同算法,计算得到用户和图书向量的相似度,具体计算公式为:
式中:Cn为用户,通过上式建立用户和图书之间的关联,SIMcn值越大,用户和图书的关联度越高,个性化推荐的质量越高。
1.4 建立高校图书馆个性化推荐模型
本文在协同过滤算法的基础
您可能关注的文档
- 努尔森扩散对崔家沟煤温度压力吸附所作贡献的数值分析.docx
- 劳动收入区域性差异与走势分析-基于1998~统计数据.docx
- 化乐水库大坝趾板基础设计方案比选.docx
- 化工工艺管道安装质量控制要点分析.docx
- 北京宋庄地裂缝分布特征及成因分析.docx
- 北京世锦赛中美男子4×100m接力对比分析.docx
- 北方地区大花蕙兰花期调控技术研究.docx
- 北斗三频中长基线差分定位性能研究.docx
- 北方地区平房仓内环流控温储粮技术应用研究.docx
- 北苍术炮制工艺研究.docx
- 全球AI红线公约的技术边界与治理逻辑:安全防控体系与实施路径解析.docx
- 知识产权实缴估值失真乱象解析:从评估偏离到合规重构的技术路径.docx
- 新型电力系统年度5000亿元投资的技术导向与落地路径.docx
- 新质生产力赋能央企发展:2025年度十大热搜背后的技术突破与战略实践.docx
- 人音版音乐一年级下册第五单元《七只小鸟在唱歌》课件.pptx
- 电网数字化率80%目标达成路径:技术融合与体系重构.docx
- 人音版音乐一年级下册第五单元《吉祥三宝》课件.pptx
- 人音版音乐一年级下册第五单元《我是一个甜甜果》课件.pptx
- 第六单元中国精神《军民大生产》《延安颂》课件2025-2026学年人音版初中音乐八年级下册.pptx
- 人音版音乐一年级下册第五单元《摇篮曲》课件.pptx
最近下载
- 小学生作文评讲课件.pptx VIP
- 教育部《中小学生信息素养提升手册(2024年新版)》全文 .pdf VIP
- 知识点 4.3 209系列转向架(一)(二)课件讲解.pptx VIP
- 抹茶生产工艺介绍-第二步:蒸青和烘干(碾茶的制作).doc VIP
- 流产手术后促进子宫内膜修复临床实践指南(2025年版).pptx VIP
- 一株新型水稻纹枯病病菌的鉴定及病菌效应蛋白的功能研究.pdf
- 209T转向架组装作业指导书.pdf VIP
- AI:新一轮科技革命改变世界——新时代的底层逻辑系列之三.pdf VIP
- 《教育从爱开始》读书分享.pptx VIP
- 使用消化酶类药物治疗消化不良的专家共识意见.pptx
原创力文档

文档评论(0)