基于不同数据集的协作过滤算法评测.pdfVIP

基于不同数据集的协作过滤算法评测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于不同数据集的协作过滤算法评测.pdf

ISSN 10 — — 00-0054 清华大学学报 (自然科学版)2009年 第49卷 第4期 34/40 CN 11—2223/N JTsinghuaUniv(Sci&Teeh),2009,Vo1.49,No.4 59O一594 基于不同数据集的协作过滤算法评测 ~ 董 丽 , 邢春晓。, 王克宏 (1.清华大学计算机科学与技术系,北京 100084;2.清华大学 图书馆,北京 100084;3.清华大学 信息技术研究院,北京 100084) 摘 要:针对协作过滤算法评测中普遍采用单一数据集,该 协作过滤技术n在 1992年首次提出之后,在个 文将传统 的User—based(近邻数为 20)、Item~based、Item 性化推荐系统中得以广泛应用。协作过滤的基本思 average、Itemuseraverage和 SlopeOne5种算法应用于 想是根据用户兴趣的相似性来推荐资源,通过比较 MovieLens和Book—Crossing两种数据分布特征不同的数据 代表不同用户的用户描述文件的异同(即比较用户 集。结果显示,在Movielens这种评分值相对比较稠密的数 间的兴趣相似度),根据和 目标用户具有相似兴趣的 据集上,SlopeOne算法的预测精度最好;而在评分值相对 其他用户(和 目标用户具有相似兴趣的用户被称为 比较稀疏的Book~Crossing数据集上,Item—based算法的预 测精度最好,SlopeOne的预测精度最差。选择算法应根据 目标用户的 “邻居”)的观点向用户推荐信息资源。 用户和资源分布具体情况确定。 协作过滤技术的优点是能应用于那些不能直接 关键词:协作过滤;个性化推荐;算法评测 获取特征的资源 ,还能为用户发现更多新的兴趣 。但 是也存在一些 问题,就是随着系统用户和资源的增 中图分类号:TP391.4;TP311.13 文献标识码:A 文章编号:i000—0054(2009)04—059005 多,系统的性能会越来越低 ,在数学模型上表现为数 据稀疏性和可扩展性 。目前,有关协作过滤方面的研 究主要是围绕解决这两个问题展开的。而在实际的 Collaborativefilteringalgorithm 应用中,系统的用户和资源分布情况不同,不同算法 evaluationforvariousdatasets 的表现也不同,现有协作过滤算法评测中普遍采用 DONG Li‘,XING Chunxiao。.WANG Kehong 单一数据集,而忽略算法可能受不同数据集特征影 (1.DepartmentofcomputerScienceandTechnology, 响的情况 。在公开可用的数据集 中,Movielens和 TsinghuaUniversity,Beijing100084,China; 2.TsinghuaUniversityLibrary,Beiji

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档