个性化推荐系统的综述精要.ppt

下载文档 降价啦

12
0
约 23页
2016-03-10 发布于湖北
举报
版权申诉
保障服务

个性化推荐系统的综述精要.ppt

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

个性化推荐系统的综述精要.ppt

个性化推荐系统综述个性化推荐的基本简介简介：个性化推荐是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。推荐系统的基本概念概念：个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台，以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品，自动完成个性化选择商品的过程，满足客户的个性化需求，推荐基于：网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录，推测客户将来可能的购买行为。推荐系统的模块 1.用户建模模块 2.推荐对象建模模块 3.推荐算法模块用户建模模块建立用户模型之前，需要考虑下面几个问题：（1）模型的输入数据有哪些，如何获取模型的输入数据。（2）如何考虑用户的兴趣及需求的变化。（3）建模的对象是谁。（4）清楚了上述内容后，怎么建模呢。（5）模型的输出是什么。模型的数据输入类型：（1）用户属性。（2）用户手工输入的信息。（3）用户的浏览行为和浏览内容。（4）推荐对象的属性特征。获取模型输入数据的方式：（1）有显式获取。（2）隐式获取。（3）启发式获取推荐对象建模对推荐对象进行描述之前考虑以下几个问题：（1）提取推荐对象的什么特征，如何提取，提取的特征用于什么目的。（2）对象的特征描述和用户文件描述之间有关联。（3）提取到的每个对象特征对推荐结果会有什么影响。（4）对象的特征描述文件能否自动更新。推荐对象的领域包括，比如报纸、Usenet 新闻、科技文档、Email，还有诸如音乐、电影等多媒体资源等等。对对象的描述主要基于内容的方法和基于分类的方法两大类方法。推荐算法模块推荐算法（或叫推荐策略）是整个推荐系统中最核心和关键的部分，在很大程度上决定了推荐系统类型和性能的优劣。推荐算法的分类： 1.基于内容的推荐 2.协同过滤推荐 3.基于社会网络分析的推荐 4.基于网络结构的推荐 5.混合推荐推荐系统的体系结构推荐系统的体系结构研究的重要问题就是用户信息收集和用户描述文件放在什么地方，服务器还是客户机上，或者是处于二者之间的代理服务器上。推荐系统可分为3种：（1）基于服务器端的推荐系统（2）基于客户端的推荐系统（3）基于代理的推荐系统基于服务器端的推荐系统最初的推荐系统都是基于服务器端的推荐系统基于客户端的推荐系统基于客户端的推荐系统中，用户信息的收集和建模都在客户端完成。基于代理的推荐系统在这一结构中，用户信息的收集、用户建模和推荐服务都在代理端实现。推荐系统的性能评价评价推荐系统性能的好坏通常用推荐的精确度和推荐效率两个指标进行衡量。（1）精确度的衡量最典型的指标是平均绝对误差和平均平方误差以及标准平均误差（2）推荐效率为推荐列表中用户喜欢的产品与系统中用户喜欢的所有产品的比率精确度的衡量最典型的指标是平均绝对误差（MeanAbsolute Error，MAE）和平均平方误差（Mean Squared Error，MSE）以及标准平均误差（Normalized Mean Absolute Error，NMAE）。它们的计算形式分别如式（13）和（14）以及（15）所示。其中n 为系统中用户i 打分产品的个数，pia 和ria 分别为预测打分和实际打分。ni 为系统中用户-产品对的个数。rmin和rmax分别为用户打分区间的最小值和最大值。召回率（recall）和精确率（precision）也可以用来衡量推荐的准确度。召回率定义为推荐列表中用户喜欢的产品与系统中用户喜欢的所有产品的比率。计算方法如式（16）所示：准确率：推荐列表中用户喜欢的产品和所有被推荐产品的比率，计算方法如式（17）所示：其中Nrs 推荐列表中用户喜欢的产品个数，Nr 用户喜欢的所有产品的个数，Ns 为所有被推荐产品的个数。召回率和精准率评价系统时的最大问题在于它们必须一起使用才能全面评价算法的好坏，综合二者提出了一个F指标，计算方法如式（18）：衡量推荐算法的衡量指标推荐多样性的衡量推荐冷门对象的能力一、推荐多样性的衡量一个好的推荐系统应能够向用户推荐不同类型的对象，而不是同类型的对象。其中平均加权距离S 作为衡量推荐列表的外部多样性指标，比如推荐列表的长度为L，用户i 和用户j 的推荐类表中相同项的数量为Q，则加权平均距离（Hamming distance）定义如式（22）：把该值得平均作为衡量推荐类表外部多样性的指标，如式（23）：