web系统工程作业docx.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
web系统工程作业docx

利用行为分解改进用户兴趣话题档案 近年来,随着因特网的迅猛发展,Web信息呈几何级数增长,人们需要花费大量时间才能找到自己想要的信息,个性化推荐作为信息过滤的重要手段,是解决当前信息过载问题的一种很有效的方法。许多推荐通过建立个人话题兴趣档案为用户寻找感兴趣的内容,一般的社交网络都是直接结合用户感兴趣的主题,从各种各样的消费和发贴的行为、评论等得出用户的感兴趣话题档案。许多推荐通过建立个人话题兴趣档案为用户寻找感兴趣的内容,一般的社交网络都是直接结合用户感兴趣的主题,从各种各样的消费和发贴的行为、评论等得出用户的感兴趣话题档案。通过将单个用户的兴趣分布分割成若干个行为配置文件,就可以获得更好且更简洁的兴趣话题信号。在社交媒体,推荐系统直接结合用户的主题感兴趣的信号,从各种各样的消费和出版的行为,如社会媒体的职位,??们的创作,评论,点赞的人或喜欢建立用户配置文件。在这里,我们提出了单独的模型用户的局部利益,来自这些不同的行为信号,以构建更好的用户配置文件。由于发表需要耗费更多精力,所以一个发表的信号应该比一个简单的点赞手势更能说明主题兴趣所在。通过将单个用户的兴趣分布分割成若干行为配置文件,我们获得更好和更简洁的主题感兴趣信号。 建设一个个性化的推荐系统需要有两个子问题构成。一个是特色管理,这个是信息的采集,表明用户长期和短期的兴趣。另一个是利用数据挖掘和机器学习方法对这些信息进行正确的分析。由于今天的社交媒体平台的规模,我们有大量的用户以及主题/项目。不同的行为在用户的个人档案中所占的比重不一样。比如用户发布或者评论的帖子对他们来说更重要一些,而仅仅是点赞的话也许只是有点兴趣。一个学术研究的用户可能会对她的研究兴趣发表文章,并对最近的政治和时事发表评论。但是他只会对一些比如园艺骑车等私人爱爱好点赞。我们使用矩阵分解技术,使用这种技术,我们称之为“行为分解”,可以更准确预测关键兴趣。不同的行为习惯代表了不同的兴趣爱好,我们首先在Google+社交网络上面分析了用户的行为习惯。我们把这个问题看成矩阵问题,用矩阵分解来解决。分为三步:1、从用户项目矩阵中学习一个潜在的嵌入空间;2、表示嵌入空间中的用户和项目;3、计算用户选项的相似度。我们分别对不同行为的话题兴趣模型使用嵌入分解技术。首先,我们建立一个嵌入模型,将每个用户的喜好分为几个不同的行为背景下的偏好。这是训练嵌入模型的关键。然后,我们结合了用户的主题偏好不同的行为,预测局部兴趣。也就是说,我们的方法为不同的行为参与类型提供了不同的建议。给定一个用户的活动内容主题,如创建邮政关于“数据挖掘”,或1篇文章关于“视频游戏”,我们的预测框架将推荐主题为不同的行为动作。这项工作的贡献是:我们引入了分离用户兴趣的一般概念;我们开发了一种方法来执行“行为分解”,在该方法中,我们将矩阵分解方法直接应用于用户行为,直接构造一个嵌入空间,这是用来预测未来的话题兴趣;我们评估一个大型数据集的行为分解,并显示在建设用户档案中获得的改进。 当前,用户兴趣的获取一般有两种方式:一种是通过显式的方法在信息检索之前通过用户对自己兴趣程度的标注,实现用户兴趣的获取。这种方式一般能够获得较为准确的用户兴趣表现,但在现实的应用过程中,用户经常并不愿意直接参与对页面的兴趣标注,直接进行用户的兴趣标注一方面很容易造成一部分用户隐私数据的泄露,也不可避免的影响了用户的正常浏览过程,同时,即使用户标注了自己感兴趣的程度,也未必能够准确地反映用户的实际兴趣。第二种方式是通过利用数据挖掘技术从用户实际浏览行为中挖掘、提取用户的兴趣表现来估算兴趣度,这种方法不需用户直接参与,同时用户实际浏览行为也正是用户当前实际兴趣的表现,这种方法已成为目前获取用户兴趣模型的主流方法之一。用户在实际页面浏览过程中的行为多种多样,既有用户对页面本身所采取的操作,又有用户对鼠标和键盘的操作,还有用户的生理、情绪变化等。利用用户的浏览行为估算用户的兴趣爱好,其关键问题之一是在收集用户的浏览行为之前,需要确定哪些浏览行为能真正的反映用户兴趣;其次,对于收集来的用户实际浏览行为如何进行量化,最终合理的表示用户的实际兴趣也是应用的关键问题之一。 大量研究指出,用户对网页的兴趣度与其在该网页上的浏览行为密切相关。用户的很多浏览行为暗示出用户的喜好 与 兴 趣,如 查 询、浏 览 页 面、标 记 书 签、反 馈 信 息、点击鼠标、拖动滚动条、前进、后退等。用户访问页面时的停留时间、访问次数、保存、编辑、修改等动作同样表现用户兴趣根据浏览行为反映用户兴趣的方式,可以将用户的浏览行为分为生理行为、显著行为和间接行为3类。生理行为指反映用户在浏览过程中思想和情绪波动的浏览行为,生理心理学研究表明,当人发现自己感兴趣的事物时,在生理上会发生一系列反应,如用户眼睛的

您可能关注的文档

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档