- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于AT―LSTM弹幕评论情感分析
基于AT―LSTM弹幕评论情感分析
摘要:弹幕评论能更准确、具体地反映出用户在观看视频时的即时情感和褒贬评价,因此本文提出了一种基于注意力机制的LSTM(AT-LSTM)情感分析模型。首先基于注意力机制更好的挖掘出整个弹幕评论中的情感关键词;然后利用LSTM模型有效结合视频中前后弹幕评论的情感依赖关系,最终提取出基于主题的“高光”视频片段。实验结果表明所提方法的准确度比传统LDA和LSTM方法有了进一步的提高。该模型可以帮助用户更准确的获取网络视频弹幕数据中包含的情感信息,进而提供了一种新的视频检索与视频推荐新途径。
关键词:深度学习;弹幕评论;情感分析;AT-LSTM
中图分类号:G206 文献标识码:A 文章编号:1007-9416(2018)02-0210-03
1 引言
弹幕视频是近年来出现的一种将观众评论与视频内容相结合的视频形式,融合了视频与社交元素。用户可以在观看视频的同时发表评论,且弹幕评论会以弹幕的形式实时出现在视频上。
弹幕评论数据包含评论文本及其对应的视频时间点信息,因此与一般的评论数据相比,弹幕数据能更准确、具体地反映出用户在观看视频时的即时情感和褒贬评价,这些情感和评价信息可以为其他用户在选择视频时提供参考。利用情感分析技术从网络视频弹幕中提取情感信息,可以帮助用户获取视频评论文本整体的情感倾向,以及评论情感随时间的变化情况。随着弹幕功能在各大主流视频网站的推广,弹幕评论中的观点和情感表达将更具普遍性和参考性。在弹幕评论情感分析的基础上,可以建立根据评论情感的视频检索新途径,满足更多元、个性化的检索需求。
本文结合弹幕视频特性设计一种基于注意力机制的LSTM情感分析模型(AT-LSTM)来提取视频中的精彩片段:
(1)有效的分析了视频中弹幕评论的前后相关性,从而更准确的获得弹幕评论的主题信息。(2)依据主题模型对弹幕中的词进行主题分类并计算视频片段之间的情感相似度,得到基于主题分布的精彩视频片段。(3)通过加入注意机制突出了弹幕评论中关键性情感词的影响作用,进一步提高了模型的准确率。
2 相关工作
2.1 弹幕定义
弹幕:弹幕可以定义为一个三元组,其包含了用户输入内容、发送时间、用户ID。本文主要对中文、英文、数字三种形式的弹幕内容进行分析,其中英文弹幕包含了部分网络用语,如“QAQ”( 表示哭泣)等;数字部分包含了常用网络流行词,如“233”(表示大笑)和“666”(表示厉害)等。
如图1所示不同语言的弹幕形式,弹幕视频截图上方的文字为用户发送的弹幕。
2.2 “高光”视频片段
“高光”视频片段:本文的宗旨就是找出弹幕视频的情感鲜明突出的“高光”视频片段(“Highlights” video shots)。所谓“高光”视频片段,即视频中的精彩片段,是指用户对视频某一部分内容带有强烈感情色彩讨论。
通过研究发现,视频弹幕评论包含有一定的“时间相关性”,即当用户发送弹幕评论Ci时,他们可以参考当前以及先前的弹幕评论内容,因此,相邻的评论在语义向量上可能是相似的,当视频呈现一段精彩内容时(高光片段),用户通过大量参与评论从而产生了对应的“主题”。基于这种现象,我们在弹幕评论Ci周围的一定区域Aj=(视频片段的长度为te-ts),则我们把具有某种主题T的评论的视频片段Aj称之为“高光”视频片段。
2.3 Attention-based LSTM(AT-LSTM)
LSTM(Long Short Term Memory)是一种有效的链式循环神经网络(Recurrent Neural Network,RNN),被?V泛用于语言模型、机器翻译、语音识别等领域。标准的LSTM检测不到弹幕评论中重要的情感评论。为了解决这个问题,我们建立了一种注意机制,它可以捕捉句子的关键部分的注意力机制。
文本的输入序列为输入序列{x1,x2,x3,…,xt}作为历史节点,历史节点的输入向量的累加求均值,得到文章总体的输入向量表示X’,X’作为编码阶段最后的输入。{h1,h2,h3,…,ht}对应于输入序列{x1,x2,x3,…,xt}的隐藏层状态值。Ht对应于输入X’的隐藏层状态值。
图2中的ai就是历史节点对于最后节点的注意力概率。Ai越大表示这个词在弹幕评论中的情感语义越重要。图中输入序列{x1,x2,x3,…,xt}是弹幕评论文本的词语表示,X’是弹幕评论总体的输入向量表示。计算出{x1,x2,x3,…,xt}对于弹幕评论总体的影响力权重,可突出关键词的作用,减少非关键词对于文本整体语义的影响。
aki= (公式2-1)
eki=vtanh(Whk+Uhi+b) (公式2-2)
其中aki表示
您可能关注的文档
最近下载
- 如何开好早会..ppt VIP
- 《机械基础》课件 孟莹 单元1--4 静力学--- 螺纹连接与螺旋机构.pptx
- 靶向二代测序在感染性疾病诊疗中的规范化应用专家共识解读PPT课件.pptx VIP
- 可编程控制器应用技术第2版[西门子S7-1200](PLC)高职全套教学课件.pptx
- 国外矿产勘查报告规范要求.pptx VIP
- 国外矿产勘查报告规范要求.pptx VIP
- 自考 新思想学习资料 15040新思想 主观题.pdf VIP
- 郑功成“社会保障学”名词解释.pdf VIP
- 《PLC应用技术(西门子上册)第2版》中职技工全套教学课件.pptx
- 澳大利亚矿产资源和矿石储量报告规范JORC2004(中文版).doc VIP
文档评论(0)