加入情感分析的Stacking模型在网络剧播放量预测中的应用①.docxVIP

  • 10
  • 0
  • 约8.84千字
  • 约 21页
  • 2023-08-12 发布于浙江
  • 举报

加入情感分析的Stacking模型在网络剧播放量预测中的应用①.docx

? ? 加入情感分析的Stacking模型在网络剧播放量预测中的应用① ? ? 李明珠, 米传民, 肖 琳, 许乃元 (南京航空航天大学 经济与管理学院, 南京 211106) 1 引言 网络剧是通过互联网播放的一类连续剧, 以手机、平板、计算机等网络设备为播放媒介. 我国网络剧诞生于21 世纪初, 在近20 年的时间内经历了由多元化向精品化方向发展的蜕变, 越来越受到观众青睐.骨朵传媒数据显示, 从2015 年起, 网络剧平均播放量从2015 年的0.72 亿次上升至2018 年的7.18 亿次, 平均年增长率为224%[1]. 在学术领域, 很多学者从制作、播放、营销等方面对网络剧的发展现状和发展路径进行分析[2,3]. 从以往的研究可以看出, 相比于电视剧, 网络剧呈现了灵活性、碎片化、创新性、互动性、多元化等特征, 宣传力度、作品质量、明星效应、口碑效果等是影响网络剧播放的重要因素[2]. 虽然很多学者对网络剧的研究提出了许多建议, 但只是从定性或思辨的角度进行分析. 目前已有一些学者从定量分析的角度对网络剧的播放量展开研究: 王大员等用多元线性回归MLR 模型对低成本网络剧播放量进行预测, 最终拟合优度R 方为0.455[4]; 肖兴辉等从营销节奏的角度,使用微博转发数、评论数和点赞数对营销效果进行量化, 运用BP 神经网络、RBF 神经网络和决策树CHAID算法进行预测, 但都呈现出过拟合的趋势[5]; 李聪等在对弹幕进行情感分析的基础上, 构建网络剧播放量的贝叶斯概率预测模型, 但只是提出了构想, 没有具体实现[6]. 目前对于网络剧播放量的研究还处于初级阶段,尚未考虑观众评论的情感态度对播放量的影响, 并且预测模型的选择也有待优化. 与此同时, 以往的研究都是对最终的播放量进行预测, 但由于互联网数据的滞后性以及播放量的动态变化性, 无法根据播出时期的实时动态数据对播放量进行调整, 因此有必要对网络剧播放量进行分阶段的预测. 对于网络剧播放量预测模型的选择, 可以参考票房预测的相关模型. 网络剧播放量与票房都属于影视范畴, 且有一些共同的影响因子, 如主演影响力、豆瓣评分、相关微博数等[4]. 目前票房预测模型可以分为3 大类: 统计模型, 例如线性模型[7]和概率模型[8]; 时间序列模型, 例如向量自回归VAR 模型[9]; 机器学习模型, 例如支持向量机SVM[10]和神经网络[11]. 随着集成学习算法的不断发展, 集成学习模型也被用于票房预测, 如属于Bagging 集成思想的Random Forest[12], 属于Boosting 集成思想的梯度提升树 (gradient boosting decision tree, GBDT)[13], 轻量级梯度提升机 (light gradient boosting machine, LightGBM)[14], 极端梯度提升树 (extreme gradient boosting, XGBoost)[15,16]以及 Stacking 模型融合算法[14]. 可以得出, 集成学习算法可以通过集成各个机器学习模型的优势, 获得比传统的机器学习模型更佳的预测结果. 观众评论的情感倾向是影响其他观众观看的重要因素, 一定程度上会对网络剧的播放量带来影响, 而以往研究的影响因素并未纳入评论的情感特征. 在票房的预测中, 很多学者对评论进行情感分析, 对评论情感倾向量化从而对票房进行更准确的预测. 对于量化方法, 有对社交媒体上的评论进行情感分类, 直接将正面、负面、中性情感的评论数目作为预测指标[17–19];也有在得出正面、负面、中性情感数目的基础上通过计算相应的比率 (如占总评论的数目, 正负情感比)作为预测指标[20,21]; 也有通过对情感词和程度词的权重进行赋值计算评论的情感得分对评论情感进行量化[22,23].评论情感得分的量化方法相比于单纯计算数量和比率更加体现了评论的情感强度大小, 扩大了情感数据的差异性. 然而, 很少有研究将评论的点赞数纳入情感得分的计算中. 点赞数代表了一条评论的认可度, 已有研究表明用户的点赞行为对票房会产生显著的正向影响[24]. 将点赞数融入情感得分的计算中, 更能体现所有评论用户的整体情感倾向, 提高数据的代表性. 综上可知, 对于网络剧播放量的研究仍然处于初级阶段, 预测的准确性有待提高. 本文通过借鉴票房预测的相关算法和模型, 以国产网络剧播放量预测为研究对象, 在对评论进行情感分析得出情感得分的基础上, 使用Stacking 集成学习模型进行预测. 在情感分析上, 本文基于SO-PMI 算法构建网络剧领域情感词典,并与基础情感词典合并得到综合情感词典, 对评论进行情感分类, 再结合修饰词权重和点赞数权重

文档评论(0)

1亿VIP精品文档

相关文档