网站大量收购闲置独家精品文档,联系QQ:2885784924

大数据:你的私人定制.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据:你的私人定制.doc

大数据:你的私人定制   关于大数据,有个人性化的说法——大数据就像青少年之间的性,每个人都以为别人正在进行中,所以每个人都把它列在自己的计划上;每个人都在口耳相传,没几个人真的见过——对互联网公司而言,大数据是个时时被提起的宏大战略,但真正靠谱的产品很少见;而对普通用户来说,大数据更像是个耳熟能详的抽象概念。   如今,普通用户也有了可以利用大数据的入口。2013年年底,视频网站爱奇艺在综艺节目的进度条下,添加了两个不起眼的小字:绿镜。点击后,你所看的将是剪辑过的节目片段合集。举个例子,当下最热门的综艺节目《爸爸去哪儿》一期的总共时长是90分钟,开启绿镜模式之后,你所看到的是29分钟的精华版。   负责剪辑节目的不是网站的视频编辑,而是后台系统,或者说所有观看视频的普通用户。大多数人在观看视频时,都会根据自己的兴趣暂停、快进、倒退。对于爱奇艺首席技术官汤兴来说,这就是用户在无意识地通过这些动作来评价内容的好坏,“用鼠标来反映哪些是他们认为好看的、哪些是无聊的。”   简单的说,绿镜就是将所有用户“评价”汇总,再经过后台系统的运算,将最受欢迎的片段剪辑出来,形成精华版视频。   这不是视频网站第一次应用大数据,视频网站的首页推荐,播放页边栏上的“猜你喜欢”,都是以用户行为分析为依据。绿镜在算法上,甚至比前者更为简单,却是更实用的大数据产品,之前的产品精准度还不足以让大多数用户注意到它们,而绿镜在没有经过宣传的情况下,第一天就有20万用户点击。   相信很快就会有许多绿镜的类似产品出现,这种产品不仅仅能够为普通用户节省时间,更重要的是让电视台等内容制造方准确了解哪些明星、桥段才是观众喜闻乐见的。   用户定制的时代来了。   灵感来自吐槽老板   这个产品最初的起源,只是几个工程师的玩笑。2013年2月份,爱奇艺CEO龚宇以嘉宾的身份登上湖南卫视的访谈节目《天天向上》,与他同期上节目的嘉宾还有电视剧《笑傲江湖》的主演霍建华与陈乔恩,这期节目隔天就在爱奇艺上线。   几个爱奇艺的工程师,本着对领导的原始好奇心,偷偷在网站后台用算法总结出这期节目的用户行为数据。结果印证了他们的猜想,在龚宇出场的时间里,收视曲线降到谷底,“惨不忍睹”,等到陈乔恩和霍建华出场后,曲线陡然升上高峰。与看电视时的被动接受不同,当节目的进度条可以随意调节的时候,嘉宾究竟受不受欢迎这件事儿就变得更加直观残酷。   这次吐槽式的观察成为绿镜开发的灵感和起点。花了两个多月时间,爱奇艺的绿镜算法研发完成。   实际上,这个产品并不是由一个部门完成的,而是由爱奇艺内部不同部门协作完成。具体的说,以《爸爸去哪儿》为例,一个绿镜版的产生,先需要收集数据,在达到一定数量后进行清洗,然后根据清洗后的数据建立模型,完成视频编辑。   所谓清洗,就是去年汤兴所说的“噪音”数据,这些数据并不是真实的用户行为,举例来说,如果一个用户在某一点上暂停几秒钟,他可能是在截屏,如果是几分钟那上厕所的可能性更大。   在建模时,先要按重要度来为快进快退、暂停、分享、评论以及截图等行为赋予不同的权重,然后为每个片段打分,之后的计算过程非常简单,一个30分钟片长的视频,只需要十几毫秒的时间就能完成。   在互联网世界里,收集用户数据比传统电视行业要容易得多。用户的所有交互行为都会在互联网上留下痕迹,存储在各家公司庞大的数据库里。生成绿镜版本的前提是节目有10万以上的播放量,这个数字不难达到。在视频网站上,一线综艺节目整体播放量的单位通常是亿,像《爸爸去哪儿》这种有热度的节目,上线一个小时之后就能够生成绿镜版本。   “每隔20分钟,系统还会重新更新一次。”爱奇艺产品经理赵超越介绍道。当初那群好奇地研究龚宇是否受观众欢迎的工程师中,戴着黑框眼镜的赵超越是其中之一。她是90后,算是看着综艺节目、玩着互联网长大的一代人。对他们来说,光是看节目是不够的,他们更想参与其中。   和其他大数据产品一样,绿镜还不够成熟。用绿镜看节目无可回避的一个问题是画面不够连贯。大数据剪刀手只能挑出那些受欢迎的片段,它们分散在节目的各个桥段里,生成绿镜版的时候并不能保证衔接流畅。这也是绿镜为什么暂时只在综艺节目上运用的原因。综艺节目对剧情连贯性没有很高的要求,观众主要看的是自己中意的表演嘉宾,哪怕画面突然被切断也没有很大的关系。在电视剧、电影上,很难想象被切割后的情节还能够同样被观众欢迎并接受。   在目前的版本中,爱奇艺用最简单粗暴的办法来解决连贯性的问题,就是干脆不去考虑如何保持剧情连贯,而是在每个片段中间暂停一下,闪现“绿镜”标志,然后直接转到下一个片段。   绿镜的版本仍然在优化。在内容的连贯度没那么容易解决的情况下,研发团队将重心放在满足每个用户对时间的需求上。在大数据的世界里,

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档