基于用户行为与内容综合分析评估的视频推荐方法研究.docVIP

基于用户行为与内容综合分析评估的视频推荐方法研究.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户行为与内容综合分析评估的视频推荐方法研究.doc

基于用户行为与内容综合分析评估的视频推荐方法研究   摘 要 单独基于用户行为或基于视频内容的推荐方法[1],不利于准确地将视频推荐给用户。为了提高视频推荐的准确度,本文将将结合用户行为与视频内容的分析方法。通过分析用户行为数据的历史数据,找到用户之间的相似性。在相似性用户的基础上,分析视频内容找到视频之间的相似性。将用户行为相似度与视频内容相似度二者结合起来进行数据挖掘,会更有利于视频个性化,从而更准确性地进行推荐。实验结果证明,结合用户行为和视频内容的推荐,是提高视频推荐准确度行之有效的一种方法。   【关键词】用户行为 视频内容 视频推荐   1 引言   随着互联网的迅速普及,网络传输、数据存储和视频压缩等相关技术的快速发展,来自于不同领域的各种视频数据正在以惊人的速度增长,其规模已十分庞大,全世界每天大约有数百万的视频被上传。视频作为主流媒体的传播介质之一,特别是在移动端。在国内,每天上传视频的数据量相当庞大,大约数十万的视频被处理。视频的点击率也是相当的惊人。在如此繁多的视频中,用户想要获取高质量、感兴趣的视频很不容易,商家进行精准广告推送也成为问题,而推荐系统已成为解决这些问题的主流方法之一。   国际视频网站的架构多是基于推荐系统发展而来。在国内的视频推荐发展中,经历了从人工筛选推荐到自动数据挖掘分析并自动推荐的过程。虽然推荐方法很多,但能推荐高质量、个性化、匹配度高的视频推荐方法仍是一个难题。   用户行为分析方法最早来源于管理学领域,通过分析客户的行为来指导企业运营管理。目前该方法被广泛应用于互联网数据分析,特别是针对用户推广方面,以满足企业精细化地应对用户需求。对于视频方面的用户行为分析,多数是基于用户操作视频过程中产生的一系列动作所构成,处理这些行为动作可以采用多维向量的方式,本文在分析和处理这些数据时将采用该方法。另外一些分析视频行为的方法包括用户提交视频喜爱方向、用户付费视频统计、用户收藏、分享内容等方法。单独对于用户行为相似度的处理,寻找相似用户是模糊的,因此在视频推荐中是不够准确的。   对于视频内容的推荐,早期是通过视频分类,给视频打上标签,尽管视频分类可以细化,但相对于视频内容来还是泛泛的。视频是由一帧帧的图片在时序上的组合,用户观看视频时,会对视频内容在时序上进行一个选择,即选择自己喜爱的内容。对于每一段视频内容,根据用户的观看程度是可以进行细化标签的。视频的标签内容往往来源于用户的行为,即上传者的描述,用户针对某段内容的评价,用户针对用户的回复等等。   单一的用户行为分析推荐方法和传统的视频内容推荐方法是不够准确的。用户行为是针对用户群体性的,视频内容是针对用户群体对视频群体的一个映射集合。为了解决视频推荐的精准度问题,本文对基于用户行为和视频内容的推荐方法进行了研究。   2 基于用户行为的相似度   2.1 用户行为的表示方法   对于视频,用户有播放、暂停、拖拉(快进和快退)、下一个、下载、清晰度切换(流畅、标准、高清)、屏幕大小切换、声音大小、关注、分享、语言交互(弹幕、视频评论、评论回复)和退出这些行为应用场景,另外用户在某个视频上的停留时间也可以作为重要行为的参考依据。这些行为组成了某个视频的一系列行为数据,它们能反应用户对视频的关注度和兴趣爱好。   根据用户的一系列行为动作,定义行为向量如下:   A中元素为视频v的时间轴,按秒作为时间轴的计量单位。为某时刻t用户U对视频v的行为,参见行为示例列表1。表中行为方式对应的影响方向描述了用户行为对视频爱好的正负影响,用数值表示。其中快退与快进的值为一个时间段,快进为正数,快退为负数,计算方式为实际操作后的时间点减去操作前的时间点。   2.2 用户行为相似度计算   给定两个用户k和l,A和B分别表示两个用户对同一视频 的行为向量,他们的行为相似度可以采用余弦相似度进行计算,设,,则余弦相似度如下:   计算出来的余弦值在0到1之间,在这个区间内,相似度逐渐增加,当为1时,两个用户对某视频的行为相似度最大。   3 基于视频内容的相似度   3.1 视频内容的提取   视频是由一帧一帧的图片组成,很难通过图片去描述视频内容。本文采用文字的方式来描述视频内容,获取文字的方式包括视频上传描述、视频标题、视频分类和用户评价等。视频内容的描述往往依赖于视频上传者,而视频上传者对视频内容的定义是主观的,与实际内容比起来可能不够精准,会出现一定的偏差。这里将上传者描述内容Td、用户评论Tc和视频标签Tt结合起来,作为新的视频内容T。这个过程需要不停的迭代更新,原因是会有更多的评论加入到视频的描述内容中来。因此,视频内容公式可表示为:   其中Tcui表示用户u对某视频的第i次评论或回复,它

您可能关注的文档

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档