一种基于We 挖掘与图书馆服务推荐模型及其算法研究.docVIP

下载本文档

4
0
约6.9千字
约 6页
2017-09-01 发布于安徽
举报
版权申诉

一种基于We 挖掘与图书馆服务推荐模型及其算法研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于Web挖掘的图书馆服务推荐模型及其算法研究郭秋萍（郑州航空工业管理学院，河南郑州 450015）王全兰（黄河水利委员会，河南郑州 450002）摘要：本文基于Web挖掘的理论与技术，设计了一个图书馆服务推荐系统模型。该模型采用离线部分挖掘与在线部分挖掘相分离的思路，解决了服务推荐的实时性与准确性的平衡问题。并重点针对在线部分的推荐算法，给出了具体构建方法及其实现过程，为同类研究提供了一种有益参考。关键词：Web挖掘，服务推荐，算法构建，数字图书馆中图分类号：TP393,G250 One Recommendation-System Model Of digital library And Realization Based On Web Mining Guo-qiuping (Zheng Zhou Institute Of Aeronautical Industry Management , Zheng Zhou 450015, China) Wang-quanlan （Yellow River Conservancy Commission , Zheng Zhou 450003, China） Abstract：The paper designs ong model of recommendation-system to digital library.The model adopts separating data mining of off-line part and data mining of on-line part.The idea balances efficiency and exactness of mining. Aiming at arithmetic of on-line part, the paper provides one method of arithmetic designing.This research supplied a good reference for developing the recommendation-system of digital library. Key words：Web Mining，recommendatory service，arithmetic designing，digital library 随着互联网信息资源的日益增多，信息有序化程度却越来越低。用户利用现有搜索引擎虽然可以检索到海量信息，但必须对庞大结果集进行人工筛选才能获取相对有用的信息，这显然降低了图书馆服务的质量与效率。因此，能够针对每个用户的特有个性化信息，主动检索相关内容，并利用电子邮件或在线智能推荐服务，将初步机选结果回送给相应用户，将有效解决上述问题[1]。目前，关于图书馆的主动推荐服务研究已成为热点，本文立足于WEB挖掘的理论与技术，建立了一个主动推荐系统模型，并提出一种新的图书馆推荐服务算法，较明显提高了挖掘准确性，改善了推荐服务质量，为同类研究提供了一种有益参考。 1 WEB挖掘的数据源总体上说，数字图书馆中WEB挖掘的数据源主要有四种，分别是服务器端数据、客户登录数据、图书馆数据以及WEB页面数据。服务器端数据是指那些因客户访问服务器从而产生的各种相关信息，其表现形式主要有日志文件和查询数据两种，存贮位置在服务器端。常见的日志文件如：Server Logs、Error Logs和Cookie Logs等；常见的查询数据如：在线客户检索图书馆数据库时提交的查询信息等。这类数据可用于客户历史行为分析以及系统服务优化调整等方面。客户登录数据是指客户通过Web界面页向服务器提交的身份认证信息。这类数据可用于客户身份识别、专业领域分类以及兴趣爱好预测等方面。图书馆数据是指在传统关系数据库中存贮的数字图书馆站点信息、客户借阅信息、馆藏文献信息等。这类数据属于图书馆的公共性数据。 WEB页面数据是指在HTML或XML网页中嵌入的各种信息，包括文本、图片、语音、动画等。这类数据可用于文本挖掘、多媒体挖掘以及页面间超链接关系挖掘等方面。对于图书馆服务主动推荐算法来说，其面向对象主要是知识背景互不相同的客户群。因此，服务推荐的准确性与适合性关键取决于对那些与客户密切相关数据源的挖掘与分析。本文在下面进行的算法研究中，所采用的数据源主体为服务器端数据和客户登录数据。 2 图书馆服务推荐系统模型图书馆服务推荐系统的设计需要考虑推荐实时性与推荐准确性的平衡问题[2]。目前，大部分关于服务推荐技术的研究是以优先保证其实时性为前提来设计的，而以牺牲其推荐质量为代价。针对此不足，本文在综合考衡两者的基础上，建立如下系统模型，如图1所示。图1图书馆服务主动推荐系统模