基于双信息源的协同过滤算法研讨.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于双信息源的协同过滤算法研究宰 董全德1,2 l合肥工业大学计算机与信息学院,安徽合肥230009 2宿州学院计算机科学与技术系,安徽宿州234000 摘要:为了解决数据稀疏性、针对具有专门知识背景和交互性强的项目推荐,本文提出基于双信 sourceModel.Basedcollaborative 息源模式的协同过滤算法(DualInfornlation FilteringAlgorithms, DlscF),该方法判断活动用户对目标项目的兴趣程度建立在两个推荐组——相似用户推荐组(最近 邻居集合)与专家推荐组基础上,把两个推荐组的建议结合起来,形成可靠的信息源,然后,分析各 自影响活动用户对目标项目的权重,计算活动用户的最终兴趣度,实现系统推荐。 关键词:协同过滤双信息源可信度平均绝对偏差 1引 言 随着电子商务的发展,个性化推荐系统已经成为电子商务服务中一个重要元素和保持电子商务网站竞 争力的重要保证。协同过滤(collaboratiVe 户兴趣或项目特征来实现对目标用户或目标项日的推荐。协同过滤技术在许多的商务网站中得到了成功的 应用【¨。然而,传统cF技术遇到一些棘手的问题12L糟启动问题、数据的稀疏性问题、推荐的可靠性问题等 等。特别是,CF在处理交互性强、需要专门技能知识的领域,更显得力不从心。 为解决上述问题,提高CF技术的效能,研究者提出了一些改进传统CF算法。文献13】。 TAN.ELR分类器在处理不完全数据的能力,对用户一项目矩阵中缺失的评分实现填充,这种方法在解决数 据的稀疏性问题有一定的效果,但是,现有的研究结果表明。 CF 对传统cF算法性能的改变的意义不大。文献14J提出混合的推荐系统(hybrid 图要克服单个系统的缺点。最有代表性HcF是content-boostedcF,应用NB网络,填充cF评分矩阵中缺失的 数据项,构成一个不完全真实的用户评分矩阵。然后,借助带有权重的Pearson 分矩阵中,形成特殊的用户一项目的推荐。试验验证了这个算法的优越性,但该算法没有考虑需要专门知 识领域的推荐项目,而且项目的内容信息并不是都能得到,特别是对于有许多的产品种类大型电子商务网 站而言,为了实现content-boostedcF,需要提取这些产品种类的许多特征,这项工作是非常困难的。 到目前为止,所有CF算法把它们的推荐建立在一个单一的推荐组中,为了解决数据稀疏性、针对具有 InfonIlationSource 专门知识背景的项目推荐,本文提出基于双信息源模式的协同过滤算法(Dual Collaborative Model.BaLsed Filtering 在两个推荐组——相似用户推荐组(最近邻居集合)与专家推荐组基础上,把两个推荐组的建议结合起来, 形成可靠的信息源,然后,分析各自影响活动用户对目标项目的权重,计算活动用户的最终兴趣度,实现 系统推荐。 ‘作者简介:董全德(1980.),男,安徽毫州人,讲师,硕士研究生,研究方向:web数据挖掘. 2DISCF算法的相关基础知识 2.1DIscF算法的消费心里学基础 DISCF算法是建立在消费者心里学观点基础上的,影响消费者购买行为的因素很多,这些因素产生的作 用也不相同。例如:产品的特性、产品与消费者的密切关系和消费者对产品的了解15】。 在现实生活中,一个消费者在选择电影或购买日用品等小型商品时可能仅仅征求具有相同兴趣爱好的 相似用户(最近邻居集)的意见,但是,当他们在选择价格比较昂贵的产品时,例如:一台笔记本电脑, 往往更多征询专业人士的意见,这就是推荐信息源的多样性;不同的消费者在相同产品领域中对推荐源的 选择也是不同的,有的消费者会选择有着相同兴趣的最近邻居的观点,有的会更多从专业人士身上获取建 议,这就是推荐信息源的可信度;有的产品消费者愿意花大量的时间与精力去了解产品的特性,有

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档