- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
资源推荐系统
资源推荐系统Resource Recommendation System GroupID_5 石立元 张海生 吴明达 张 译 张 林 2006.01.13 Outline 选题的初衷 什么是资源推荐系统 我们的任务 资源推荐系统的设计 Main Ideas Main Data Structures Main Frame And Algorithms 关于RRS Demo 什么是资源推荐系统 资源 泛指网络上存在的可共享的数字化信息 资源推荐系统 根据大量用户对众多资源访问(查询和使用)的历史记录,分析用户可能的兴趣所在,提供资源推荐服务,把用户尚未访问、但可能喜欢的资源推荐给用户。 资源推荐与资源共享 用户需求 Q: 我需要关于某方面的资源 A: 有我感兴趣的东西吗 R: 你看看这些东东,不错的 可以先其想所想,达到较好的使用满意度 更有潜力的资源共享方式 推荐的方式 用户自定义的个性化资源 把与用户访问过的资源类似的资源推荐给用户 把某些用户访问的资源推荐给与他们兴趣类似的用户 我们的任务 构造出资源推荐系统的框架,分析各个模块的功能,给出实现的主要流程和细节。 分析资源推荐中涉及的主要问题,给出参考的算法。 构建一个模拟的应用环境,在该环境中演示资源推荐系统的主要功能和算法。 Main Ideas.1 资源推荐的前提 Assumption: 用户的兴趣是比较稳定的 用户的兴趣是比较稳定的,随时间变化的幅度是比较小的 用户的兴趣是在不断变化的,尽管幅度比较小 用户较近的对资源的访问能体现用户当前的兴趣 时间效应 Assumption: 更新的资源具有更大的吸引力 Main Ideas.2 如何发现用户兴趣? 两个假设: 如果一个用户经常访问某类资源,那么他很可能喜欢该类资源; 如果一些用户经常访问类似的资源,那么他们的兴趣可能相同。 Main Ideas.3 问题:如何进行推荐 主要考虑的因素 用户对资源类的偏好 用户之间的相似度 时间效应:兴趣的变化,资源的新颖 用户对推荐的配合程度 参考定义.1 用户的资源类的偏好 对某类资源的访问数量的相对大小作为偏好的程度 用户之间的相似度 当前相似度定义为 不对称性 如果进一步考虑时间的因素 可以考虑形成List of 资源id,Date 以dateFactor(Date)的和作为相似度 参考定义.2 时间效应:兴趣的变化,资源的新颖 兴趣保持性依时间而衰减 衰减系数 α,0 α=1 时间效应:资源的新颖 资源吸引力以时间而衰减 衰减系数β,0 β=1 用户对推荐的配合程度 用户对推荐资源的访问情况 主要数据结构.1 用户集合 Users 资源集合 Resource 系统访问日志 User Access Log Disp: 记录从某个日期(系统定义)开始用户对资源的访问历史 推荐资源访问日志 User Recommend Log Disp: 记录在某个日期(用户登录)用户对推荐资源的访问历史 用户-用户相似矩阵 User-User current-similarity matrix Disp: 记录从当前的日志计算出的用户与用户之间的相似程度 用户-用户相似系数矩阵 User-User similarity-confidence matrix (User-user similarity-index matrix) Disp: 记录基于整个访问历史的用户与用户之间的相似性程度 主要数据结构.2 用户推荐列表 User Recommend List Disp: 要推荐给某个用户资源列表 当前推荐列表Selected Recommend List Disp: 当前一次推荐给用户的资源列表 用户访问列表 User Access List Disp: 某个用户对资源访问的历史记录(从某个日期开始) 推荐必要度向量 User recommend needity vector Disp: 描述对用户进行推荐的必要度 用户-资源类系数矩阵 User-resourceclass rate matrix Disp: 用户对各个资源类的偏好程度 主要处理流程 Refresh机制 [1]整理用户访问日志 [2]计算用户两两的相似性 [3]更新用户-资源类偏好系数矩阵 [4]把当前的相似性矩阵信息添加到相似性系数矩阵 [5]可以形成每个用户topN的列表 相似性系数的更新 更新信息来源 一部分来自计算出来的当前相似性矩阵 一部分来自用户对推荐列表的访问信息(可以考虑隐性的反馈) 更新策略的制定,下面分别提供两类信息更新的参考方
文档评论(0)