- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种对数据集稀疏度不敏感的协同推荐新方法-南京大学pasa大数据
一种对数据集稀疏度不敏感的协同推荐新方法
蔡国永 吕瑞
(桂林电子科技大学广西可信软件重点实验室 桂林 541004)
(ccgycai@ )
A Novel Collaborative Recommendation Method with Low Sensitivity to Data Sparseness
Cai Guoyong and Lv Rui
(Guangxi Key Lab of Trusted Software, Guilin University of Electronic Technology Guilin, 541004)
Abstract In the field of recommendation systems, most studies on the sparseness are based on static datasets.
However, the datasets in practical application are dynamic and there exist at least two features: one is the
increasing scale of User-Item matrix for users and items join into the datasets continuously; another is the
increasing degree of sparseness. As a result, the accuracy of traditional recommendation methods will reduce
gradually with the datasets becoming sparser. Based on the above consideration, a novel collaborative
recommendation method with low sensitivity to different degrees of sparse datasets is proposed to meet the need
of practical and dynamic datasets. This method incorporates tag information and factor analysis method to
discover the most similar top-N users based on the similarity of users’ inner idiosyncrasies. Based on the most
similar top-N users discovered, an improved collaborative filtering method is designed. Extensive experiments are
conducted to compare the proposed method with other state-of-the-art collaborative filtering and the matrix
factorization methods. The results demonstrate that our proposed method can achieve better accuracy and has a
low sensitivity to different degrees of sparse datasets.
Key words recommendation system;dataset sparseness ;tag system ;factor analysis ; rating prediction
摘 要 在推荐系统领域中,针对数据集稀疏性问题的研究大都建立在静态数据集的基础上,而实际工业
应用中的数据集则往往是动态的并且具有以下两个明显的特征:1) User-Item 矩阵维度逐渐增大;2) 稀疏
程度不断增加.因此,传统
您可能关注的文档
- 2003流行性感冒讲座-香港医学会.ppt
- 2004年回顾与2005年展望及工作重点-hongkongmonetaryauthority.ppt
- 200162公钥体系结构pki-read.ppt
- 2005年文学与信息技术国际研讨会–论文关于日本-二松学舍大学.pdf
- 2007-12职代会制度建设与基层民主发展.doc
- 2006年国际热带木材协定.pdf
- 2007-2第2351期-英语四级.doc
- 2007-2009年教育部哲学社会科学研究重大课题攻关项目课题.doc
- 2008年永康众泰汽车俱乐部草案-大迈x7.doc
- 2008年浙江长兴农村合作银行年报告摘要-德商村镇银行.doc
- 一种改进的3g无线网络丢包模型及仿真方法-计算机工程与应用.pdf
- 一种改进的流程图相似度检索算法及实现-计算机应用研究.pdf
- 一种模糊概念相似度的计算方法-东北大学.pdf
- 一种用于科技项目查重的数据整合及描述模型-情报工程.pdf
- 一种离散随机petri网的性能计算和分析方法-东南大学学报.pdf
- 一种新的云存储数据容错存储方式检验方法new-电子与信息学报.pdf
- 一种移动adhoc环境下的lbs位置保护算法的研究-电子设计工程.pdf
- 一种类间交互测试的约束型标记驱动petri网模型.pdf
- 一种综合用户和项目因素的协同过滤推荐算法-东南大学学报.pdf
- 一种自适应初始轮廓的水平集演化方法的研究.pdf
文档评论(0)