- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于物品的协同过滤算法(简称ItemCF算法)是目前业界应用最多的算法。无论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法 ItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品。ItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度 该算法基于的假设是:物品A和物品B具有很大的相似度是因为喜欢物品A的用户大多也喜欢物品B。 11.2.2 基于物品的协同过滤(ItemCF) 图11-6 基于物品的协同过滤(Item CF) 11.2.2 基于物品的协同过滤(ItemCF) ItemCF算法与UserCF算法类似,计算也分为两步: 第一步:计算物品之间的相似度 第二步:根据物品的相似度和用户的历史行为,给用户生成推荐列表 11.2.2 基于物品的协同过滤(ItemCF) ItemCF算法通过建立用户到物品倒排表(每个用户喜欢的物品的列表)来计算物品相似度 11.2.2 基于物品的协同过滤(ItemCF) 图11-7用户到物品倒排表及物品相似度矩阵 用户 物品 物品 物品 ItemCF计算的是物品相似度,再使用如下公式来度量用户u对物品j的兴趣程度Puj(与UserCF类似): 11.2.2 基于物品的协同过滤(ItemCF) 其中,S(j, K)是和物品j最相似的K个物品的集合,N(u)是用户u喜欢的物品的集合,wji物品i和物品j的相似度,rui是隐反馈信息,代表用户u对物品i的感兴趣程度,为简化计算可令rvi=1 UserCF算法和ItemCF算法的思想、计算过程都相似 两者最主要的区别: UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品 ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品 UserCF算法的推荐更偏向社会化,而ItemCF算法的推荐更偏向于个性化 11.2.3 UserCF算法和ItemCF算法的对比 图11-4 基于用户的协同过滤(User CF) 图11-6 基于物品的协同过滤(Item CF) UserCF算法的推荐更偏向社会化:适合应用于新闻推荐、微博话题推荐等应用场景,其推荐结果在新颖性方面有一定的优势 UserCF缺点:随着用户数目的增大,用户相似度计算复杂度越来越高。而且UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受大众影响而推荐热门物品 ItemCF算法的推荐更偏向于个性化:适合应用于电子商务、电影、图书等应用场景,可以利用用户的历史行为给推荐结果作出解释,让用户更为信服推荐的效果 ItemCF缺点:倾向于推荐与用户已购买商品相似的商品,往往会出现多样性不足、推荐新颖度较低的问题 11.2.3 UserCF算法和ItemCF算法的对比 12.1基于大数据的综合健康服务平台 大数据存储 数据源层 技术支撑层 业务层 交互层 用户层 个人 用户 网络 医院 独立体 检机构 社区卫生 服务机构 区域医疗 信息平台 新农合 医保 社保 大数据处理 基于大数据的健康评估技术 基于大数据的个性化诊疗技术 面向普遍人 群的通用型 健康服务 面向特定人 群的主题式 健康服务 面向决策、科研 等机构的循证医 学数据服务 面向健康服 务机构的 信息服务 医疗卫 生机构 专业健康 服务机构 决策 机构 科研 机构 健康服务 相关机构 个人 用户 疾控 中心 门户网站 呼叫中心 移动终端 平台接入API 开放应 用平台 服务 第三方 检测机构 大数据集成、存储 安全隐私 数据标准 目标:构建覆盖全生命周期、内涵丰富、结构合理的以人为本全面连续的综合健康服务体系,利用大数据技术和智能设备技术,提供线上线下相结合的公众健康服务,实现“未病先防、已病早治、既病防变、愈后防复”,满足社会公众多层次、多方位的健康服务需求,提升人民群众的身心健康水平。 13.1 大数据在物流领域的应用 菜鸟网络到底是什么? 中国智能物流骨干网,又名“菜鸟” 菜鸟网络计划在5到8年内,打造一个全国性的超级物流网。 这个网络能在24小时内将货物运抵国内任何地区,能支撑日均300亿元(年度约10万亿元)的巨量网络零售额。 1000亿元投资物流基础设施 强强联手共建智能骨干网络 物流信息系统向所有的制造商、网商、快递公司、第三方 物流公司完全开放 智能物流集成商案例:阿里巴巴的中国智能物流骨干网(地网) 本章小结 本章内容首先介绍了推荐系统的概念,推荐系统可帮助用户从海量信息中高效地获得自己所需的信息 接着介绍了不同的推荐方法以及推荐系统在电子商务、在线音乐等网站中的具体应用 本章重点介绍了协同过滤算法,协同过滤算法是最早推出的推荐算法,至今仍获得广泛的应用,协同过滤包括基于用户的协同过滤算法(UserCF)和基于物品的协同过滤
文档评论(0)