- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商品搜索引擎推荐系统设计Java开发Java经验技巧.doc
商品搜索引擎一推荐系统设计-编程开发技术
商品搜索引擎一推荐系统设计
原文出处:小宝鸽
结合目前已存在的商品推荐设计(如淘宝、京东等),推荐系统主要包含系统推 荐和个性化推荐两个模块。
系统推荐:根据大众行为的推荐引擎,对每个用户都给出同样的推荐,这些推 荐可以是静态的曲系统管理员人工设定的,或者基于系统所冇用户的反馈统计计 算出的当下比较流行的物品。
个性化推荐:对不同的用户,根据他们的口味和喜好给出更加精确的推荐,这时, 系统需要了解需推荐内容和用户的特质,或者基于社会化网络,通过找到与当前 用户相同喜好的用户,实现推荐。
下面具体介绍系统推荐和个性化推荐的设计方案。
、系统推荐
2.1、 系统推荐目的
针对所有用户推荐,当前比较流行的商品(必选)或 促销实惠商品(可选)或 新上市商品(可选),以促进商品的销售量。
PS:根据我们的应用情况考虑是否选择推荐促销实惠商品和新上市商品。 (T0D01)
2.2、 实现方式
实现方式包含:系统自动化推荐和人工设置推荐。
(1) 系统自动化推荐考虑因素有:商品发布时间、商品分类、库存余量、历史 被购买数量、历史被加入购物车数量、历史被浏览数量、降价幅度等。根据我们 当前可用数据,再进一步确定(T0D02)
(2) 人工设置:提供运营页面供运营人员设置,设置包含排行位置、开始时间 和结束吋间、推荐介绍等等。
曲于系统推荐实现相对简单,因此不作过多的文字说明,下面详细介绍个性化推 荐的设计。
三、个性化推荐
3?1、个性化推荐目的
对不同的用户,根据他们的口味和喜好给出更加精确的推荐,系统需要了解需推 荐内容和用户的特质,或者基于社会化网络,通过找到与当前用户相同喜好的用 户,实现推荐,以促进商品的销售量。
3.2、三种推荐模式的介绍
据推荐引擎的数据源有三种模式:基于人口统计学的推荐、基于内容的推荐、基 于协同过滤的推荐。
(1) 基于人口统计学的推荐:针对用户的“性别、年龄范围、收入情况、学历、 专业、职业”进行推荐。
(2) 基于内容的推荐:如下图,这里没冇考虑人对物品的态度,仅仅是因为电 影A刀电影C相似,因此将电影C推荐给用户A。这是与后面讲到的协同过滤推 荐最大的不同。
相似
相似
(3)基于协同过滤的推荐:如卜?图,这里我们并不知道物品A和物品D是否相 似,仅仅考虑人对物品的喜好进行推荐。
用户c
模式采用:这三种模式可以单独使用,也可结合使用。结合我们实际情况,采用 基于协同过滤的推荐更加合适,看后期情况是否结合另外两种模式实现推荐。但 基于协同过滤的推荐这种模式,会引发“冷启动”问题。关于,冷启动问题,后 续会讨论解决方案。
3.3、用户喜好设计
判断用户喜好因素:丿力史购买、丿力史购物车、丿力史搜索、丿力史浏览等,待 确定我们可用数据再进一步细化。
用户对某个商品的喜好程度,通过不同行为对应不同分值权重,女口:历史 购买(10)、历史购物车(8)、历史搜索(5)、历史浏览(6),确定用户喜 好因素后再进-步对各个因素评分权重进行 合理的设计。
用户对商品的喜好程度最终体现:结合某个商品的不同行为统计出最终 对该商品的喜好程度,即对商品的喜好程度,最终以一个数字体现。
4、Mahout 介绍
目前选择采用协同过滤框架Mahout进行实现。
Mahout是一个很强大的数据挖掘工貝,是一个分布式机器学习算法的集合,包 括:被称为Taste的分布式I■办同过滤的实现、分类、聚类等。Mahout最大的优 点就是基于Hadoop实现,把很多以前运行于单机上的算法,转化为了 MapReduce 模式,这样大大提升了算法可处理的数据量和处理性能。
Mahout是一个布式机器学习算法的集合,但是这里我们只使用到它的推荐/协同 过滤算法。
5、Mahout实现协同过滤实例
I■办同过滤在mahout里是由一个叫taste的引擎捉供的,它提供两种模式,一种 是以jar包形式嵌入到程序里在进程内运行,另外一种是MapReduce Job形式在 hadoop ±运行。这两种方式使用的算法是一样的,配置也类似。
这里我们采用第一种引入jar包的单机模式。
3.5. 1、依赖
dcpcndcncy
groupldorg. apache. mahout/groupld artifactldmahout-core/artifactld
version0? 9/version
/dependency
dcpcndcncy
groupldorg. apache. mahout/groupld artifactldmahout-math/artifactld
version0? 9/version
/dependency
dcpcndcncy
groupldorg. apache. hadoop/grou
文档评论(0)