网站大量收购独家精品文档,联系QQ:2885784924

基于用户协同过滤的电子商务推荐算法.docVIP

基于用户协同过滤的电子商务推荐算法.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户协同过滤的电子商务推荐算法   摘要:近年来,电子商务迅猛发展。电子商务的用户越来越多,销售的商品也越来越多,信息过载的现象越来越严峻,导致用户在大量的商品信息空间中无法快速便捷地找到自己真正需要的商品。电子商务网站的个性化推荐,考虑的重点是怎样对商品信息进行有效的组织利用,怎样收集了解顾客的兴趣爱好,方便向用户提供个性化推荐。   关键词:用户协调过滤;电了商务;推算法   中图分类号:TD301.6 文献标识码:A   文章编号:1005-913X(2015)11-0053-02   一、 研究背景   现今正从信息时代迈向推荐时代。明尼苏达大学教授John Riedl提出“推荐系统将成为未来十年里最重要的变革,社会化网站将由推荐系统所驱动”。作为电子商务先驱者 ,Amazon实现了35%的销售额来自其推荐系统。 美国ChoiceStream公司调查显示:普通消费者中的45%、高端消费者中的69%更更愿意选择有推荐功能的网站;消费者购物前平均查看的商品个数在推荐系统帮助下由11.7下降到6.6;有推荐系统时选择更优的产品的消费者占比从65%上升到93% ;有推荐系统的帮助消费者将更改初始选择的比率从60%下降到2l%。   二、电子商务个性化推荐系统   (一)定义   Resnick 和 Varian 在1997 年提出了个性化推荐系统定义:“个性化推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。   (二)用户偏好数据   推荐系统要想推荐结果能够反映出用户的偏好,需要用户偏好数据的支撑。收集用户偏好数据是个性化推荐系统的重要工作,用户偏好数据的质量决定推荐的质量。用户偏好数据可分为显式数据和隐性数据两类。   1.显式数据。显式数据要求用户主动地向系统提供本人的各种信息包括偏好信息,主要是通过特定的网页直接请求用户显式输入一些个人信息,包括对某些商品的数值评分,也包括用户注册的个人基本信息,如姓名、性别、年龄、生日、背景等。用户不情愿的输入个人信息数据导致用户评分数据的极为稀疏,这是显式评分方式的明显缺点。稀疏的评分数据导致推荐系统推荐质量的下降。   2.隐性数据。隐性数据的收集方式主要是从系统的服务器上收集访问日志和各类网络资源的过程,数据的获取过程其实是采用网络数据挖掘的方法,以网络内容挖掘和网络使用挖掘为主,然后进行数据的预处理。   用户兴趣偏好的收集过程是学习、分析、明确用户的需求的过程。用户的的需求会表现在与系统进行交互的浏览行为,比如用户经常访问的页面集,用户的点击,收藏历史,浏览时间,拉动滚动条的次数,鼠标点击区域,键盘输入输出等有关操作等,推荐系统将这些用户行为信息记录并转化为反映用户兴趣偏好的数据模型,再应用于推荐生成。隐式数据依靠行为科学的研究结论,其优势在于:①数据获取的自动化程度高,用户在访问系统时不需要做其额外的事情,降低了用户与系统交互的工作量。②数据收集的“成本”较低。③各种隐式数据能结合起来生成更精确的偏好信息。   但是相对于显式数据,隐性数据的缺点也非常明显,就是对它的获取难度大、对用户偏好进行模型化的可信程度偏低。 一般情况下,用户的兴趣偏好表现的多样性和动态性,所以为了提高收集数据的质量,在很多实际应用中都采用混合式,即显示数据和隐性数据混合收集,优势互补,目的是为了更加真实、全面地获取用户的偏好信息。   三、电子商务推荐算法的研究   (一)基于内容的推荐算法   基于内容的推荐算法需要分析电子商务网站的资源内容信息,根据用户兴趣建立用户档案,用户档案中包含了用户的品位、偏好和需求信息。然后根据资源内容与用户档案之间的相似性向用户提供推荐服务。在一个这样的系统中,通常采用相关特征来定义所要推荐的物品。   (二)基于规则的推荐算法   随着数据挖掘的兴起,关联规则被应用于推荐系统,形成了一种新的推荐技术基于规则的推荐技术。基于规则的推荐技术在评价表上挖掘项目间的关联规则(项目关联)和用户间的关联规则为当前用户进行推荐。使用项目关联进行推荐时,每条项目关联的前件相当于一个兴趣组,而规则的后件则相当于这个兴趣组的推荐。如果当前用户对该规则前件中的所有项目都喜欢,那么就把规则的后件以一定可信度推荐给当前用户。而使用用户关联进行推荐时,用户关联的后件必须是当前用户,使用用户关联的前件中的用户的共同兴趣模拟当前用户的兴趣,模拟的可信度就是用户关联的可信度,以此作为推荐的依据。   (三)协同过滤推荐算法   协同过滤主要是以属性或兴趣相近的用户经验与建议作为提供个性化推荐的基础。透过协同过滤,有助于搜集具有类似偏好或属性的用户,并将其意见提供给同一集群中的用

您可能关注的文档

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档