电视剧收视率预测电视剧论文.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电视剧收视率预测电视剧论文 【摘要】电视剧的收视率和网络播放量一直是衡量电视剧热度的重要评价指标。本文在前人研究的基础上,首先对收视率的时间序列变化进行研究。采用无监督学习的流程,总结出描述收视率变化的四个特征,用k-mea聚类分析方法,依据四个特征将电视剧分成了三类,并根据每一类收视率的实际变化特点,分别采用自回归模型和灰色预测模型进行了时序预测,最终分析出了电视剧收视随时间的变化趋势。 【关键词】时间序列预测;k-mea聚类;自回归模型;灰色预测模型 1.前言 电视剧(又称为剧集、电视戏剧节目、电视戏剧或电视系列剧)是一种适应电视广播特点、融合舞台和电影艺术的表现方法而形成的艺术样式。电视剧热度值,不仅体现了人们对于娱乐生活的舆论趋势,更是电视剧平台多元化发展的体现。对于电视剧热度值的研究正在快速发展,人民大学新闻学院的周小、韩瑞娜、凌姝在其相关研究中,开展了对网上收视度与线下收视率的关系探讨,并提出了多屏发展下新的电视评估体系的参考因素[1]。此外,胡兵、邓极在《微博对电视剧收视率的影响研究》中,还深入探究了新媒体微博对于传统电视剧收视率的影响[2]。各大视频网站都在近几年推出了关于电视剧指数的综合评价体系,如“爱奇艺指数”、“优酷指数”等。本文在前人研究的基础上,逐步深入地对多屏播放模式下的电视剧热度展开了研究,探寻了电视剧收视率变化模式的客观规律,提出描述收视率变化模式的四个特征,并用k-mea方法进行聚类分析,根据三类电视剧的特点,建立了自回归模型和灰色预测模型进行时间序列预测,按类别对比了不同阶次间自回归模型的拟合效果,最终建立了通过历史数据对电视剧最后三集的收视率进行预测的模型。 2.电视剧收视率预测模型的建立和求解 2.1数据收集和预处理。本文中用到的电视剧相关信息主要来源于百度百科资料库,其中收视率数据来源于CSM城市网和全国网收视率(),播放量数据来源于腾讯、优酷、爱奇艺等主流视频网站。当一部电视剧在同一时间段于多个电视台播出时,我们将各个台收视率加在一起,作为数据用收视率。在收集到近几年电视剧的比较权威的大量数据后,我们小组对数据进行了预处理工作。电视剧的热播有很多原因,为了研究热度高的电视剧内在的规律,我们将研究对象定为近几年的“大热剧”。研究对象符合以下两条标准:(1)最近三年播出:由于近几年网络化发展迅速,收视率和播放量的发展模式与数年前有所不同。若加入很早之前的热门电视剧(如《还珠格格》、《西游记》)为研究对象,势必会造成收视率与网络播放量的异常波动,所以我们将研究对象定为近三年电视剧。(2)平均首播收视率在2%以上:通过收视率以及网络搜索量数据比较,我们发现,近三年的电视剧中,平均收视率在2%以上的电视剧,在播出时均造成了不小的轰动,并成为了当时的热点,符合我们对于研究对象热度高的要求。所以,我们用以上条件为标准,并结合了社会舆论、观众口碑和电视剧影响力等因素进行调整。从近三年所有电视剧范围内,最终选择了《琅琊榜》、《人民的名义》、《芈月传》、《三生三世十里桃花》、《花千骨》、《欢乐颂1》、《欢乐颂2》、《微微一笑很倾城》、《武媚娘传奇》、《虎妈猫爸》、《何以笙箫默》、《亲爱的翻译官》、《女医明妃传》这13部类型、风格、播出时间并不相同的“大热剧”为研究对象。2.2基于收视率特征的电视剧聚类分析。对于收视率来说,因为前几集的收视率势必与后几集的收视率有很大的关联性,所以通过历史数据可以一定程度上揭示现象的变化规律,所以我们采用时间序列预测模型。本文选用自回归模型进行预测。由于不同类型的电视剧具有不同的收视规律,显然不适合用同一模型求解。因此,我们将收视率的变化模式作为电视剧聚类标准,将研究对象进行聚类分析。为了定量地刻画电视剧的变化模式,我们对13部电视剧的收视率与集数进行了一次、二次拟合,将拟合得到的参数作为聚类特征,进行了如表1的统计分析。表1描述收视率变化模式的四个特征用上述方法,可以分别计算出13部电视剧的每个特征值,由于篇幅所限不再一一赘述。进而利用python实现k-mea聚类分析的方法,将所有电视剧分为三个类别,每个类别具有如下表2的特征:2.3收视率自回归模型的建立与优化。2.3.1利用AR(2)模型预测第一种模式电视剧收视率首先,对于第一种模式,我们选取了《人民的名义》作为研究对象,分别尝试了四种自回归模型。采用同样的训练集和测试集,来评估不同回归模型的性能。此处代表第集的收视率:经过研究发现,第三种模型,即运用前一集和前第三集的数据的二阶自回归模型拟合最好。因为收视率会受到人为因素影响,相邻剧集间收视率会小范围波动,而采用隔一集的收视率数据可以一定程度上减少波动带来的影响。而三阶自回归模型会因为参数较多,出现一定的过拟合现象。因此,我们选择的自回归模型为:我们利用《人民的名

文档评论(0)

行业资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档