- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于云填充和蚁群聚类协同过滤图书算法
基于云填充和蚁群聚类协同过滤图书算法
[摘要]针对传统协同过滤技术在图书推荐中效率不高、数据极端稀疏性及主观性强等问题,提出一种基于云填充和蚁群聚类的协同过滤图书推荐方法,首先根据蚁群聚类算法得到用户群分类,然后在进行协同过滤前预先通过云模型填充用户――项目矩阵,以降低数据的稀疏性。实验结果表明,该算法在推荐精度上有明显的提高。
(关键词]协同过滤;蚁群聚类;云填充;图书推荐
[中图分类号] TP18;TP301.6 [文献标识码JA (文章编号]1008-0821(2015)05-0078-05
随着网络技术的不断发展,图书馆服务向个性化、智能化方向发展成为必然趋势。虽然现在各级图书馆都建立了信息服务平台,但大部分信息服务平台只是提供简单的查询功能,需要用户主动提交查询的内容,然而随着图书流通数据的不断积累,读者在这种平台中很难快速的获得所需要的信息,智能图书推荐系统则是通过分析不同用户的兴趣所在,主动帮助用户从海量的信息中找出感兴趣的信息,为用户提供个性化的信息服务。因此构建有效的智能图书推荐系统是提高图书馆信息服务水平的重要途径,为此研究者提出了很多推荐方法:基于内容的推荐,混合推荐和协同过滤等,同时结合先进的技术,如聚类,关联规则,贝叶斯网,神经网络和图论模型等来实现这些方法。
目前协同过滤是应用最成功的推荐技术,在许多领域也得到了广泛的应用。但是它也仍然存在很多的问题。由于用户和资源种类的爆发式增长,用户――项目矩阵成了高维矩阵,与此同时,用户评分的资源却很少,一般情况下在1%以下。而图书馆中也会遇到同样的问题,图书数目会不断增加,并且随着时间的推移,借阅记录也会成阶梯式增长,数据的极端稀疏性大大降低了传统的协同过滤的推荐效率。目前文献提出了用k-means对用户进行聚类,以实现对用户――项目矩阵的降维,但由于k-means算法需要事先指定初始聚类中心,而初始聚类中心对聚类结果有较大的影响,所以具有一定的主观性,导致协同过滤图书推荐质量的降低。
针对上述问题,本文提出了一种基于云填充和蚁群聚类的协同过滤图书推荐方法,尝试利用改进的蚁群聚类算法对用户进行聚类,然后在得到的小的聚类中,利用云模型对用户――项目矩阵进行填充,最后采用基于用户的协同过滤算法来计算用户间的相似性并找到最近邻居集,得到目标用户对未评分项目的预测评分,形成Top-N推荐。目的在于缩小目标用户最近邻的搜索范围,有效减少搜索开销,从而达到推荐效率的提高,同时,通过云模型填充用户――项目矩阵,有效地缓解数据极端稀疏性和主观性强的问题。
1 基于云模型的数据填充算法
1.1 云模型简介
云模型是李德毅院士提出的一种定量定性转换模型,能够实现定性概念与其数值表示之间的不确定性转换。正态云模型是最重要的一种云模型,它利用云模型的3个数字特征期望,熵和超熵形成特定的发生器,生成与定性概念相对应的定量转换值。
云发生器分为正向云发生器和逆向云发生器。正向云算法是由云的3个数字特征C(Ex,En,He)通过正向云发生器生成相应的云滴(x,y),而大量云滴聚集在一起形成云,实现定性概念向定量的转换。逆向云计算是由Ⅳ个云滴(x,y)通过逆向云发生器生成云的3个数字特征C(Ex,En,He),实现定量值到定性概念的转换。
两朵云之间的相似度可以用两朵云的数字特征向量的夹角余弦来表示,计算如下:
1.2 基于云模型的云填充算法
对于任何一个图书馆,读者对图书的评分记录是很少的,从而评估矩阵相当稀疏,导致推荐效果大大降低。为解决该问题,本文采用云填充的方法解决稀疏问题。其基本思想是:首先根据云相似性定义来计算项目之间的相似性,利用用户对相似项目的评分来预测未评分项目的评分,填充用户项目矩阵。具体的过程是,先找出未评分的项目,采用云模型计算项目之间的相似性,找出该项目的最近邻,最后得出未评分项目的评分。
算法1:基于云模型的云填充算法
输入:用户――项目矩阵
输出:填充较完整的用户――项目矩阵
Stepl:根据用户――项目矩阵 ,统计出项目的评分频度向量厶,然后通过逆向云计算,得出每一个项目的评分特征向量v(Exi,Eni,He,)(1≤i≤n);
Step2:根据云的相似性度量公式(1)来计算未评分项目j和其他项目间的相似性,得到项目相似度矩阵;
Step3:找出未评分项目j的最近邻居集Mi,邻居集Mj中的项目与项目i的相似性依次降低;
Step4:利用文献[8]的方法来预测用户对项目,的评分 其中simj,n是项目j和项目n的相似度;Ri.n是用户i对项目n的评分,n是任意的项目p的相似项目。
例如,系统中有4名读者Anne、Tim、John、Jo
原创力文档


文档评论(0)