基于模糊聚类数字图书馆个性化推荐系统方案设计.doc

下载文档 降价啦

0
0
约4.6千字
约 8页
2017-09-20 发布于福建
举报
版权申诉
保障服务

基于模糊聚类数字图书馆个性化推荐系统方案设计.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于模糊聚类数字图书馆个性化推荐系统方案设计

基于模糊聚类数字图书馆个性化推荐系统方案设计摘要：用户建模是数字图书馆个性化推荐系统中的关键技术，本文依据中图法对用户兴趣进行了建模，并通过Apriori关联规则算法挖掘了信息资源各类别间的关联，然后通过FCM算法对用户进行聚类分析得到目标用户的最近邻，在Top_n最近邻居集中通过协调过滤技术产生推荐。实验结果表明，本文提出的方案是可行的和有效的，也为创新数字图书馆个性化服务提供了一种新的思路。 Abstract： User modeling is a key technology of personalized recommendation system. According to the Chinese library classification， we established the user interest model， and mined the link of the information resources through the Apriori algorithm. Then we get the target users nearest neighbor by clustering analysis to the user through FCM algorithm and produce recommend through the collaborative filtering in the top_n nearest neighbor concentration. Experimental results show that the proposed scheme is feasible and effective， and also provide a new way for the innovation of digital library personalized service. 关键词：数字图书馆；推荐系统；模糊聚类；协同过滤 Key words： Digital Library；recommended system；Fuzzy Clustering；Collaborartive Filtering 中图分类号：TP39 文献标识码：A 文章编号：1006-4311（2013）06-0174-03 0 引言数字图书馆个性化推荐系统通过有效利用不同层次、不同类别的数据资源，以满足不同用户的个性化需求，已成为当前提高数字图书馆的服务质量、效率和信息资源利用水平的一种重要工具。如康奈尔大学图书馆的My Library[1]、Stanford大学数字图书馆Fab系统[2]、NEC研究院的CiteSeer系统[3]等都以不同形式向用户提供了个性化信息服务。如何构建一个有效的个性化信息推荐系统，快速高效地从海量的数据和信息中获取有关知识，提高资源检索和推荐的智能水平，满足各类用户不同的个性化需求，已成为数字图书馆领域研究的一项重要内容。作为个性化推荐系统的核心技术，协同过滤是当前应用最广、研究最多的推荐技术，它根据与目标用户兴趣相似的邻居用户的偏好信息产生对目标用户的推荐。协同过滤技术主要通过其他用户对项目的评价进行推荐，无需考虑推荐内容的形式，相比信息检索、基于内容的推荐等技术，具有一定的优越性，Amazon、CDNow、MovieFinder等都采用了协同过滤的技术来提高服务质量。但随着系统用户和资源数量的急剧增长，协同过滤技术也存在冷启动问题、最初评价问题、和扩展性问题等[4]。本文提出了一种基于协同过滤盒模糊聚类相结合的推荐技术，通过对用户文献资源使用记录的分析，得到用户的文献偏好类别及权值，建立用户兴趣模型，在此基础上，使用FCM算法对用户进行聚类分析，得到相似用户的Top_n最近邻居集，从而出生推荐。 1 用户兴趣建模 1.1 用户兴趣的收集与表示数字图书馆环境下，用户兴趣信息主要包括：用户注册信息、图书借阅记录、用户定制信息、Web服务器日志等，这些数据的收集主要包括显性收集方式和隐性收集方式两种[5]。用户兴趣信息收集好后，需要对这些数据进行预处理，包括数据清理、格式转化、归一化处理等步骤，本文不再赘述。对用户兴趣信息进行预处理后，下一步工作就是如何表示用户对某一类资源的兴趣爱好。本文依据中图法来对文献资源进行分类，并通过建立“多层分类树”的方式来表示读者对各类文献资源的兴趣爱好，如图1所示为某一用户计算机技术领域的“多层分类树”。图1中，每个结点（分类）都有一个权值，其中父亲点的权值为其子结点之和，所有叶子结点的权值之和为1。每个结点包含子结点及与同层结点的关系（关联程度），如某一读者对“算法设计”领域的