协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究5000概要.docVIP

下载本文档

3
0
约5.46千字
约 11页
2017-03-10 发布于湖北
举报
版权申诉

协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究5000概要.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究5000概要

协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究【摘要】现今的信息化时代，纸质文献由于传播范围受限，阅读人群固定，已经不能满足更多人对于最新信息的需求，以电子期刊和在线文档的形式在网络上传播可以满足科研人员对于最新信息的需求。由于网络上的信息过于庞杂，在数以万计的资料中准确找到与自己研究方向相关的信息变得十分困难，因此如何利用现在的网络资源和计算机技术准确定位所需信息就显得尤为重要。本文主要介绍了协同过滤技术在高校图书馆个性化服务的设计和应用。【关键词】数字图书馆；协同过滤；图书推荐随着Internet的飞速发展，电子商务等行业应运而生，各大网站为了在新时代抓住用户的需求，纷纷将Agent技术、Web数据挖掘技术应用到为了每个客户的个性化推荐系统中。个性化服务充分利用各种资源优势，以以人为本的理念获得了客户的认可。因此，在教育、科研等领域也纷纷引入了个性化服务理念和技术，由于高校图书馆的藏书和读者比较专业，专业文献的出版增速还在提高，专业之间经常出现交叉融合，在这样大的库藏中，读者自行找到自己需要的读物是一件相对繁琐的事情，如果能够在图书馆现有的计算机自动化处理系统和数据库技术上构建一个推荐系统，根据读者之前的借阅信息进行分析汇总，发现读者的阅读兴趣，向读者推荐相似种类的读物可以达到完善图书馆服务，了解读者需求的目的。 1协同过滤技术应用于高校图书馆学术资源个性化推荐服务的必要性关联规则技术主要作用是在大量的数据中发现项集之间的相关联系，协同过滤挖掘则是对具有相似兴趣的用户或是具有相似属性的物品的相关推荐。在日常生活中，我们在打算购入一类书的时候，我们通常会询问周边的同事、朋友最近有没有看过相同类别的书，并请求推荐，或者到网上了解这类图书的最新资讯，在这一系列综合分析过后，我们多半会选择接受平时跟我们兴趣爱好相似的人的建议。这个过程基本可以称作协同过滤的核心思想。协同过滤就是利用集体智慧的典型方法，扩展来讲就是利用具有相似的兴趣爱好、拥有共同的经验的群体的喜好向系统使用者推荐可能感兴趣的资讯，系统使用者通过合作机制回应系统推荐的资讯，系统记录下来从而达到过滤的目的，进而对其他人筛选资讯起到优化的作用。协同过滤的思想就是把跟你爱好相近的人喜欢的但是你还没有接触过的资讯推荐给你，根据你曾经使用过的物品挑选类似性质的物品推荐给你。 1.高效图书馆的现状第一，实现全文检索在内的低级信息化。检索操作要求用户给出能够表示自己需求的信息的查询关键词，因此检索出来的文献质量直接取决于用户给出的检索关键词，如果用户对于自己的借阅需求不能简洁、准确的定位的话，就不能快速的找出符合要求的文献。所以大部分检索系统所具备的高级检索功能在方便一部分人群的时候，同时将另一部分人拒之门外。第二，图书数据包含的元素稀少，全文检索功能适用范围很有限。图书数据一般包含图书书名、作者、出版社等基本信息，并不包含读者希望了解的图书内容，甚至也没有图书简介。这样的话有很多优秀的图书就会因为图书名字的原因不能被很多读者检索到。有本书叫做《菜鸟啃Excel》，这本书主要教授初入门者如何进行数据分析，图书的书名并没有提到“数据分析”，在图书数据中就没有“数据分析”一项，高校图书馆又相对封闭并没有可供参考的第三方数据和相似网页链接中的锚文字可以补充有关的元信息，所以这本书不能被提交“数据分析”检索词的用户检索到，白白流失了很多读者。第三，高校图书馆主要都是专业类的藏书，并且用户间的专业差异比较大，导致了高校图书馆有很多专业书籍不会被经常借阅。据统计，本文实验的图书馆藏书近200万册，其中唯一图书超过45万册，但是其中被借阅过至少一次的仅仅占了47.51%，剩下超过一半的书籍并没有被借阅过，这一数据足以证明图书馆的书籍并不能实际意义上的满足用户的需求，目前的图书馆系统不能密切联系专业用户和专业图书，并没有借阅过得书籍对于公共资源来说是一种巨大的浪费，不利于知识的传播和发扬。 1.协同过滤技术的原理协同过滤的实现算法主要分为：基于模型和基于内存的协同过滤算法。实现协同过滤的步骤如下：收集用户偏好。用户的偏好可以分为显性和隐形收集，显性收集方式主要包括评分、评论、投票，隐形收集方式主要有购买和查看。在实际运用中，我们收集用户的行为通常有多种。在得到用户的数据之后，首先要对收集到的数据进行预处理，预处理之后，按照不同应用的行为分析方法，得到每个用户偏好的二维矩阵，其中一维是用户列表，另一维是物品列表，得到的值是用户对物品的偏好。寻找类似的用户或物品，找到最近的邻居。根据以下三种算法寻找距离最短的用户，基于相关系数的相似度，基于预先相似度和基于调整余弦相似度。 1..1基于用户的协同过滤基于用户的协同过滤的核心思想是首先以用户对物品的偏好程度为