- 17
- 0
- 约2.28万字
- 约 6页
- 2018-12-13 发布于天津
- 举报
基于机器学习的高校图书馆用户偏好检索系统研究.PDF
第59卷 第11期 2015年6月
基于机器学习的高校图书馆用户偏好检索系统研究
1 1 2
■ 沈敏 杨新涯 王楷
1 2
重庆大学图书馆 重庆400044 重庆大学自动化学院 重庆400044
摘要:[目的/意义]针对大数据环境下高校图书馆检索系统的信息超载问题,提出一种机器学习方法,为
用户提供个性化的偏好检索服务。[方法/过程]通过提取用户检索行为大数据中的用户特征,利用监督机器学
习方法,在线学习可随用户偏好同步变化的自适应检索模型,预测用户对文献的选择概率,优化检索结果的排
序。[结果/结论]设计出用户偏好检索原型系统,介绍用户偏好检索系统工作流程,对比分析系统效果,并对系
统进行客观评价。
关键词:机器学习 高校图书馆 用户偏好 偏好检索
分类号:G250
DOI:10.13266/j.issn.0252-3116.2015.11.020
1 引言 据重庆大学图书馆对过去3年数字图书使用情况
的统计显示,门户访问量以20%的速度逐年递增,2014
随着网络技术、云计算技术、数据库存储技术、移 年全年门户访问量达 90.3万次,文献下载量达
动互联网技术在高校图书馆中的深入融合应用,高校 1138.2万篇。访问规模的不断增加,使得图书馆平台
图书馆的馆藏文献越来越丰富,用户访问频率越来越 积累的用户数据越来越多,这些海量数据都蕴含着丰
高,积累的各类数据量越来越多,高校图书馆已经进入 富的用户特征,如果能提取并利用该特征建立用户的
[1]
大数据时代 。智能分析、挖掘大数据中蕴含的知识, 文献偏好模型,将有助于实现基于偏好的检索结果排
将会极大地释放其“大价值”,为用户提供个性化、专 序,用户找到满意文献的时间会大大缩短,图书馆个性
业化服务,构建更加完善的高校图书馆大数据生态系 化服务功能将得以最大释放。同时,也为图书馆向用
[2]
统 。 户提供个性化知识推荐服务打下基础。
文献检索是高校图书馆的一项重要职能,是其服 本文将从高校图书馆用户检索行为数据中提取相
务用户的一种主要方式,也是用户开展科学研究工作、 关文献特征,基于在线监督机器学习方法,构建可随用
撰写论文的一种必要手段。虽然高校图书馆的文献检 户偏好同步变化的自适应检索模型,预测用户对特定文
索方式已由传统的手工检索转变为计算机检索,但是 献的选择概率,为对检索结果中的文献排序提供依据。
在大数据环境下,以“关键词匹配”为主要运算方式的
[3] 2 相关工作
计算机检索无法满足海量用户的多样化检索需求 。
笔者以“在线学习”为关键词在重庆大学图书馆中文 2.1 用户偏好检索
发现系统中进行检索,得到25718条检索结果,即使 用户偏好检索是信息检索领域的重要研究内容,
加上“时间范围、文献类型”等检索策略,检索结果的 在给定查询条件的基础上,通过分析用户行为特征挖
信息超载现象依然严重,要在如此海量的检索结果中 掘用户偏好,为用户提供个性化检索结果。目前关于
迅速找出满意的文献,犹如大海捞针。同时,随着笔者 用户偏好检索的主要研究有用户偏好学习方法、偏好
对文献偏好发生变化,当使用相同关键词再次检索时, 算法、偏好框架和偏好模型等。偏好学习方法是通过
不得不再次花大量时间对海量检索结果进行重新筛选。 对用户检索的研究,总结出的快速掌握知识的方法。
本文系国家社会科学基金项目“智慧图书馆理论与系统实践研究”(项目编号:13XTQ009)研究成果之一。
作者简介:沈敏(ORCID:0000
原创力文档

文档评论(0)