- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基干组合算法电子商务推荐系统
基于组合算法的电子商务推荐系统 摘 要随着信息数据的日益发达,对于各大商业网站而言,能够对用户进行良好的推荐也是非常重要的。本文章,首先分析了单一推荐系统算法的不足,然后提出一种组合推荐算法。为客户快捷便利地寻找到所需的商品信息,推荐合理的商品,提高网站的推荐效率
【关键词】协同过滤 FP-Growth 组合算法
互联网时代的到来,用户时常面对大量的数据信息,然而却无法有效的从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这种现象就叫做信息超载
其中,最能解决信息超载问题的方法就是推荐系统。推荐系统根据用户的信息特征、兴趣、用户浏览和购买记录等,预测用户可能感兴趣的产品,然后将产品推荐给用户。使用户能够在大量的信息和产品数据中快速有效地找到自己感兴趣的产品
对于各大电子商务的推荐网站来讲,最为重要的是为用户推荐感兴趣的商品,因此可以留住客户,增加客户的忠诚度,所以,一个良好的推荐系统对于商家也是必须的
1 推荐算法简介
1.1 协同过滤推荐算法
在推荐算法中,协同过滤推荐是应用最为广泛的一种算法。它主要分为基于用户的协同过滤和基于项目的协同过滤两种。基于项目的推荐系统算法核心:搜索目标项目的最近邻居,也就是计算目标项目与其他项目的相似度,再利用用户对最近邻居项目的评分进行预测,预测用户对目标推荐项目的评分,产生前N个项目的推荐列表,最后将推荐列表推荐给用户
随着网站中用户数和商品数的日益增加,协同过滤算法存在以下问题:
(1)冷启动问题;
(2)数据稀疏性;
(3)可扩展性问题
1.2 关联规则推荐算法
关联规则是数据挖掘领域的重要技术,在推荐系统中,就是应用数据挖掘技术从用户的浏览记录和购买历史等数据,产生关联规则,系统基于关联规则给出推荐。主要用于实现交叉销售,帮助用户发现一些潜在的但是用户自己还没有发现的商品
关联规则的算法主要有两种:Apriori算法和频繁项目增长模式(FP_growth)算法
FP-Growth算法是一种基于频繁项集的关联规则算法。这种算法采用一种称为FP-Tree的特殊前缀索引树作为存储频繁项目集的数据结构,在建树过程中不断将频繁项目压缩到这棵频繁树上,这样可以大幅度的压缩频繁项目所占空间的大小
FP-Growth算法主要通过两次扫描事务数据库,第一次扫描用于构建头表,第二次用于建立FP前缀树,以此得到频繁项目集。然后,为每个频繁项集构建它们的条件FP树,最后,对这些条件FP树进行递归的频繁项集挖掘
2 推荐系统建模
推荐系统主要分为3部分:搜索用户行为信息记录模块,根据这些信息数据分析用户喜好的分析模块,以及推荐系统中最为核心也是决定推荐效果的推荐算法模块
2.1 用户行为数据记录
用户的行为包括显性反馈行为和隐性反馈行为。其中,显性反馈行为记录用户对商品相对明确的喜好行为,例如评分、投票、转发等。面对网站给出的5分评分制,用户比较喜欢用5分和1分,其他的分数则很少有用户打。因为用户在浏览网站时,有时并不喜欢对浏览的商品进行评分,就会对商品进行模糊的评分,就不能有效的反馈出用户对该商品的兴趣。隐性反馈行为数据弥补了显性评分行为的不足。用户浏览或者购买商品的行为就是一种隐性的行为
对于推荐系统中的协同过滤算法和关联规则算法,两种算法选取的数据源不太相同。其中,基于协同过滤的推荐算法主要是根据用户的历史评分即显性行为反馈数据进行推荐,而基于关联规则的推荐算法是挖掘用户的浏览记录和购买记录即隐性行为反馈数据,产生关联规则,然后进行推荐
2.2 推荐的基本流程
首先经过数据的抽取、转换、清洗等一系列的操作,从原本的业务数据中提取出用户属性信息、产品属性信息以及用户偏好信息,建立用户模型和产品模型。然后利用单个推荐算法或者多种推荐算法组合成的推荐算法产生初始推荐集,推荐集可以直接推荐给用户,也可以经过排序或过滤后将Top-N个产品形成推荐列表推荐给用户
2.3 组合算法推荐
在推荐系统中,其算法都有一定的缺点,会导致推荐的准确率降低。为了取其优点,去其缺点,推荐算法中经常使用组合算法来优化单一的推荐算法。对于组合算法,Robin了提出了加权、变换、混合、层叠等几种组合方法
在本论文中,为了优化协同过滤推荐算法带来的稀疏性和冷启动的问题,将在协同过滤推荐算法中引入关联规则算法,将两种算法进行组合,其思路如下:用户对产品进行评分后,更新用户的评分矩阵,同时运用基于项目的协同过滤推荐算法,计算各个项目之间的相似性,根据项目之间的相似性和用户的评分历史行为为用户生成推荐列表。而对于用户没有产生评分但有购买历史的产品,系统采用FP-Growth算法,计算出项目频繁项,产生
文档评论(0)