个性化推荐知识汇总概要1.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个性化推荐知识汇总概要1

一 基于协同过滤(collaborative filtering,CF)的推荐系统通过收集来自其他相似用户或项目的评价信息,自动预测当前用户的兴趣偏好。协同过滤的基本假设是用户会更喜欢那些相似用户偏爱的商品,已被广泛应用在一些大型的商业系统,如亚马逊和阿里巴巴等。 目前,协同过滤算法主要包括基于内存的、基于模型的以及二者相混合的推荐技术”。使用最多的模型是k最近邻(k-nearest neighbor,kNN)协同过滤技术,包括基于用户推荐和基于项目推荐两种技术。 一般说来,本体描述了某个应用领域的概念和概念之间的关系,使得它们具有唯一确定的含义,获得该领域的相关知识,提供对该领域知识的共同理解,便于用户和计算机之间进行交流。 OntoECRec推荐模型 二 1995年,卡内基·梅隆大学的A.RDben等人在美国人工智能协会上提出了个性化导航系统we-watcher,真正标志着个性化服务的开始;1997年3月,(communications of the AcM)。组织了个性化推荐系统的专题报道,标志着个性化服务已经被技术界高度重视;1999年,德国Dresden技术大学的J.Tania实现了个性化电子商务原型系统TELLIM,标志着个性化服务开始向全球发展;2000年,NEc研究院的D.B.Kurt等人为搜索引擎atesecr增加了个性化推荐功能,实现citeseer的个性化。2001年,纽约大学的GediminaS Adomavicius和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro。 个性化推荐服务体系结构中,信息收集模块是个性化服务系统的基础模块。用户的信息包括了用户的个人基本资料、购买的历史记录及浏览记录等。个人基本资料可以从用户注册表单中获得;购买的历史记录主要存放于电子商务网站的后台交易数据库中,包含了每位用户以前历次购物的详细情况记录,如购物时间、商品清单、价格、折扣等, 同时也可以收集用户放入购物篮而未购买的商品记录,以及用户过去浏览过的商品信息等。当然要搜集用户的行为信息,日志文件是必不可少的,如要收集服务器日志,则要在服务器端获取,抽取出特定用户的访问记录;如要收集用户浏览的页面和浏览行为,则既可以在用户端获得,也可以在服务器端从用户记录中获得。 三 尽 管 协 同 过 滤 技 术 ???个 性 化 推 荐 系统 中 获 得 了极 大 的 成 功 , 但 随 着 站 点 结 构 、 内容 的复 杂 度 和 用 户人 数 的 不 断增 加 , 协 同 过 滤 技 术 的 一 些 缺 点 逐 渐 暴露 出来 , 主 要 有 : ① 稀 疏 性 (sparsity ): 在 许多 推 荐 系 统 中 , 每 个用 户 涉 及 的信 息 量 相 当 有 限 , 在 一 些 大 的 系 统 如 亚马逊 网 站 中 , 用 户 最 多 不 过 就 评 估 了 上 百 万 本 书 的1 %~ 2 , 造 成 评 估 矩 阵 数 据 相 当稀 疏 , 难 以 找 到 相似 用 户 集 , 导 致 推荐 效 果 大 大 降低 . ② 扩 展 性 (scalability ): “ 最 近 邻 居 ” 算 法 的 计算 量 随 着 用 户 和 项 的增 加 而 大 大 增 加 , 对 于 上 百万之 巨 的 数 目, 通 常 的 算 法 将 遭 遇 到 严 重 的 扩 展 性问题 . ③ 精 确 性 (accuracy ) : 通 过 寻 找 相 近 用 户 来 产生 推 荐 集 , 在 数 量 较 大 的 情 况 下 , 推 荐 的可 信 度 随 之降 低 . 四 一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块.行为记录模块负责记录用户的喜好行为,例如问答、评分、购买、下载、浏览等.问答和打分的信息相对好收集,然而有的用户不愿意向系统提供这些信息,那么就需要通过其他方式对用户的行为进行分析,例如购买、下载、浏览等行为.通过这些用户的行为记录分析用户的潜在喜好产品和喜欢程度.这就是模型分析模块要完成的工作.模型分析模块的功能能够对用户的行为记录进行分析,建立合适的模型来描述用户的喜好信息.最后是推荐算法模块,利用后台的推荐算法,实时地从产品集合中筛选出用户感兴趣的产品进行推荐.其中,推荐算法模块是推荐系统中最为核心的部分. 协同过滤推荐系统最大的优点是对推荐对象没有特殊的要求,能处理音乐、电影等难以进行文本结构化表示的对象. 基于用户的协同推荐算法随着用户数量的增多,计算量成线性加大,其性能会越来越差.因此有的推荐系统采用基于产品相似性的协同过滤算法,在产品的数量相对稳定的系统中,这种方法是很有效的,例如Ama-zon的书籍推

文档评论(0)

yaocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档