推荐系统学习汇报.pptxVIP

下载本文档

12
0
约 27页
2017-01-20 发布于湖北
举报
版权申诉

推荐系统学习汇报.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

推荐系统学习汇报

学习汇报2蒋炎红2016.5contents1.前期回顾2.推荐算法的流程检索用户-资源评分数据将用户-资源评分数据表示为向量并形成向量确定用户目标确定与用户i有共同评分资源的用户的集合J取Ri,s值最大的前N个资源推荐给用户计算J中用户数M进入循环(for (x=1;xM;x++))预测用户i对资源s的评分Ri,s检索用户i与J中用户j共同评分过的资源集合Res i,j检索邻居集X中用户j对目标资源评分Rj,x计算用户i和用户j的相似度取相似度最大的前T个用户作为目标用户的邻居集X协同过滤推荐系统的案例分析赵大钱二孙三李四TCP/IP协议解析1110算法导论0110人工智能1100Linux操作系统0000概率统计0101TCP/IP协议解析算法导论人工智能Linux操作系统概率统计赵大3——6————钱二125——5孙李36——————李四————————7TCP：Vecl1=1,1,1,0 算：Vecl2=0,1,1,0人：Vecl3=1,1,0,0 Linux:Vecl4=0,0,0,0概：Vecl5=0,1,0,1TCP与其他书目的相似度：Sim1，2=0.82 Sim1，3=0.82 Sim1，4=0.82 Sim1，5=0.41人与其他书目的相似度：Sim2，1=0.82 Sim2，3=0.5 Sim2，4=0 Sim2，5=0.5数据支持1.用户信息库2.学习行为数据3.资源信息库4.用户评分库数据处理1.数据清理2.数据转化3.归一化相似用户的聚类形成模型计算数据稀疏度否计算匹配度，产生推荐内容过滤冷启动是否大于阈值预测评分，产生推荐协同过滤是数据支持：1.获取数据的方式，即为用户的特征提取，有显式获取，隐式获取，启发式获取2.数据存在于数据库的管理系统中。数据库管理系统用于数据的存储和管理，主要涉及到原始数据和转化数据的存放及表之间关系的确立，并便于程序访问和使用。数据处理：1.数据清理具体来说是一个数据优化的过程。删除那些不合要求的记录，能够更加有效地为用户获取高质量的推荐商品。随着时间的变化，用户的学习或感兴趣的内容会发生变化，对于需要的商品会产生与之前较大差别。删除时间太早的用户记录，能够更好的把握用户当前的需求。2.数据转化式是将用户的信息用向量来表示。3.归一化处理是把数据值限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便，其次是保证程序运行时收敛加快。建立模型：用户模型，推荐对象模型1.基于模型的方法不是基于一些启发规则进行预测计算，而是基于对已有数据应用统计和机器学习生成的模型进行预测。目前，基于模型推荐的协同过滤算法主要有聚类模型，Bayes模型，关联规则模型，语义生成模型等。2.用户模型：建模方式主要有遗传算法，基于机器学习的方法，例如TF-LDF、自动聚类、贝叶斯分类器，决策树归纳和神经网络方法等。（1）遗传算法采用遗传结合、遗传交叉变异以及自然选择等操作实现建模，通过遗传进化满足用户兴趣变化时完成模型的更新。（2）机器学习：a.TF-LDF将用户感兴趣的文档表示成关键词向量，并计算出每个关键词权重来建立用户模型 b.使用贝叶斯分类器的系统计算用户浏览或访问过的推荐对象属于某个给定类的概率，然后依据概率将资源项目分类来建立用户对这些资源项目的偏好模型 c:使用决策树归纳作为用户模型学习技术的系统将用户偏好的获取过程表达成一颗决策树，用户从根节点开始，被引导完成一系列问题的回答。树的每个节点表示了决策点，所采取的方向取决于问题的回答或者对可用数据的计算。一旦叶节点被达到，则可得到对用户偏好的完整描述 d：运用神经网络建模的算法，对系统对用户偏好的输入假设进行学习并调整网络连接权重，直到网络中的所有节点达到稳定激活状态。此时输出层中被激活的节点所对应的模式类，如感兴趣/不感兴趣类，即表示了系统识别的用户偏好 e：聚类将具有相似特征的项目或用户分类，使用这类技术的系统一般建立用户群组的综合模型3.推荐对象模型：基于内容和基于分类的方法相似用户的聚类-FCM模糊c-均值聚类算法是一种逐步迭代的算法，每步迭代都沿着目标函数减小的方向进行。步骤1.对一些数据进行初始化：（1）待聚类数据总数 n；（2）聚类类别数C，2=C=n; (3)迭代停止阈值ε；（4）聚类原型模式,0= =1; (5)迭代计数器b，b=0；（6）加权指数m，m一般情况下取m=2；步骤2.根据式a计算各个数据的隶属函数用于更新划分矩阵: 对于?i,k,如果，?0,则有：μ 其中为样本与第i类的聚类原型之间------(a) 的度量距离。?i,r,使则有： =1，并且对j≠r, 相似用户的聚类-FCM步骤3.根据公式(a)更新聚类原型聚