基于模糊聚类的数字图书馆个性化推荐系统方案设计.docVIP

下载本文档

2
0
约4.39千字
约 9页
2019-09-15 发布于北京
举报
版权申诉

基于模糊聚类的数字图书馆个性化推荐系统方案设计.doc

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE PAGE 1 基于模糊聚类的数字图书馆个性化推荐系统方案设计　　摘要：用户建模是数字图书馆个性化推荐系统中的关键技术，本文依据中图法对用户兴趣进行了建模，并通过Apriori关联规则算法挖掘了信息资源各类别间的关联，然后通过FCM算法对用户进行聚类分析得到目标用户的最近邻，在Top_n最近邻居集中通过协调过滤技术产生推荐。实验结果表明，本文提出的方案是可行的和有效的，也为创新数字图书馆个性化服务提供了一种新的思路。　　Abstract：Usermodelingisakeytechnologyofpersonalizedrecommendationsystem.AccordingtotheChineselibraryclassification，weestablishedtheuserinterestmodel，andminedthelinkoftheinformationresourcesthroughtheApriorialgorithm.Thenwegetthetargetuser’snearestneighborbyclusteringanalysistotheuserthroughFCMalgorithmandproducerecommendthroughthecollaborativefilteringinthetop_nnearestneighborconcentration.Experimentalresultsshowthattheproposedschemeisfeasibleandeffective，andalsoprovideanewwayfortheinnovationofdigitallibrarypersonalizedservice. 　　关键词：数字图书馆；推荐系统；模糊聚类；协同过滤　　Keywords：DigitalLibrary；recommendedsystem；FuzzyClustering；CollaborartiveFiltering 　　中图分类号：TP39文献标识码：A文章编号：1006-4311（2013）06-0174-03 　　0引言　　数字图书馆个性化推荐系统通过有效利用不同层次、不同类别的数据资源，以满足不同用户的个性化需求，已成为当前提高数字图书馆的服务质量、效率和信息资源利用水平的一种重要工具。如康奈尔大学图书馆的MyLibrary[1]、Stanford大学数字图书馆Fab系统[2]、NEC研究院的CiteSeer系统[3]等都以不同形式向用户提供了个性化信息服务。如何构建一个有效的个性化信息推荐系统，快速高效地从海量的数据和信息中获取有关知识，提高资源检索和推荐的智能水平，满足各类用户不同的个性化需求，已成为数字图书馆领域研究的一项重要内容。　　作为个性化推荐系统的核心技术，协同过滤是当前应用最广、研究最多的推荐技术，它根据与目标用户兴趣相似的邻居用户的偏好信息产生对目标用户的推荐。协同过滤技术主要通过其他用户对项目的评价进行推荐，无需考虑推荐内容的形式，相比信息检索、基于内容的推荐等技术，具有一定的优越性，Amazon、CDNow、MovieFinder等都采用了协同过滤的技术来提高服务质量。但随着系统用户和资源数量的急剧增长，协同过滤技术也存在冷启动问题、最初评价问题、和扩展性问题等[4]。本文提出了一种基于协同过滤盒模糊聚类相结合的推荐技术，通过对用户文献资源使用记录的分析，得到用户的文献偏好类别及权值，建立用户兴趣模型，在此基础上，使用FCM算法对用户进行聚类分析，得到相似用户的Top_n最近邻居集，从而出生推荐。　　1用户兴趣建模　　1.1用户兴趣的收集与表示数字图书馆环境下，用户兴趣信息主要包括：用户注册信息、图书借阅记录、用户定制信息、Web服务器日志等，这些数据的收集主要包括显性收集方式和隐性收集方式两种[5]。用户兴趣信息收集好后，需要对这些数据进行预处理，包括数据清理、格式转化、归一化处理等步骤，本文不再赘述。　　对用户兴趣信息进行预处理后，下一步工作就是如何表示用户对某一类资源的兴趣爱好。本文依据中图法来对文献资源进行分类，并通过建立“多层分类树”的方式来表示读者对各类文献资源的兴趣爱好，如图1所示为某一用户计算机技术领域的“多层分类树”。　　图1中，每个结点（分类）都有一个权值，其中父亲点的权值为其子结点之和，所有叶子结点的权值之和为1。每个结点包含子结点及与同层结点的关系（关联程度），如某一读者对“算法设计”领域的兴趣权值为0.1022，同时与之相关的领域信息有（数据库，0.72），（数据结构，0.63），后面的数字为与“算法设计”的相关度。各类文献资源的相关度值可以由专家指定，也可以通过数据挖掘方