- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
基于深度学习和多特征融合的文本情感分析研究
互联网的迅速发展,使得微博、Facebook等为代表的自媒体逐渐流行起来,
成为用户抒发情感和表达个人观点的热门社交平台。这使得大量包含情感倾向的
文本在网络中不断积累,分析这些文本背后隐藏的情感信息,可以掌握人们对热
点话题的情感变化,为相关部门在监控舆情时提供参考。
在自然语言处理中,文本情感分析是重要分支之一。它是指利用文本挖掘等
技术,从含有情感信息的文本中提取态度、观点等信息进行分析。传统的情感分
析方法可大致分为两类,一类是基于词典的方法,另一类是基于机器学习的方法。
前者依赖情感词典的质量,后者则依靠大量的优质数据,所以两者都存在一定的
局限性。深度学习的崛起,正好为文本情感分析提供了新的方法和思路。本文以
微博短文本为情感分析对象进行研究,主要研究工作如下:
微博文本内容丰富多样,但在现有的微博文本情感分析方法中,文字之外的
特征却较少受到注意,导致情感分析效果不尽如人意。为此,本文提出了融合多
特征的文本情感分析方法,构建了三种特征,分别是基于词典的情感值特征、表
情特征以及改进的语义特征,将其融合搭建了文本情感分类模型。通过爬虫爬取
微博文本,对获取的文本进行清洗标注等处理,将其作为自建数据集,用于实验
对比。实验结果表明多特征融合对情感具有更好的指示作用,相较于传统文本卷
积神经网络模型等,本文提出模型的情感分类能力得到了有效提升。此外,本文
还提出基于词频-逆文档频率算法加权的Word2vec模型用于文本词向量化,与传
统Word2vec模型进行对比,证明其具有一定的优势。
本文结合卷积神经网络(ConvolutionalNeuralNetwork,CNN)与双向长短期记
忆神经网络(Bi-directionalLongShort-TermMemory,BiLSTM)构建了文本情感分
类模型(KCNN-BiLSTM)。卷积神经网络可以提取文本的局部语义信息,而双向
长短期记忆神经网络可以提取文本的上下文信息,本文结合两种网络的优点并进
行改进,在卷积神经网络的池化层,采用K-Max池化代替最大池化,一定程度
上保留了特征的频率和部分位置信息。此外,为使模型更加完善,引入自注意力
机制来增加文本中重要词语所占权重。将本文提出的模型与其他传统深度学习网
络模型分别在二分类数据集和三分类数据集上进行实验对比,结果表明KCNN-
BiLSTM模型提高了文本情感分类的准确率,且引入自注意力机制后,模型效果
得到了进一步提升。最后,本文基于Flask框架搭建系统,实现情感分析的可视
化,具有单句文本预测、批量数据预测、数据占比展示和下载的功能。
关键词:
情感分析,多特征融合,卷积神经网络,双向长短期记忆神经网络,自注意
力机制
Abstract
ResearchofSentimentAnalysisBasedonDeepLearningandMulti-
FeatureFusion
WiththerapidprogressofInternet,socialmediaplatforms,e.g.,SinaWeiboand
Facebook,havebecomeincreasinglypopular.Usingaboveplatforms,end-userssend
poststoexpresssentimentsandshareopinionsindailylife,leadingtotheaccumulation
oftextualdatawithemotionaltendency.Thesesentimentinformationonsocialmedia
arevaluableforstudiestotracktheshiftofhumanemotionabouthottopicsandanalysis
thepublicopinionwhenaneventtakesplace.
Asamajorresearchdirectionofnaturall
您可能关注的文档
- 基于深度学习的糖尿病视网膜病变智能诊断方法研究.pdf
- 基于深度学习的图像分析算法研究.pdf
- 基于深度学习的无人机目标检测算法研究.pdf
- 基于深度学习的用户界面组件检测算法研究.pdf
- 基于深度学习的中文情感分析研究.pdf
- 基于深度学习的自然语言生成SQL方法研究与应用.pdf
- 基于深度学习意图识别和槽位填充研究.pdf
- 基于深度置信神经网络预测模型的数控车床切削力谱编制.pdf
- 基于神经网络的增量学习模型研究与实现.pdf
- 基于生成对抗和图注意力的异质信息网络节点表示学习研究.pdf
- 英语人教PEP版八年级(上册)Unit4+writing+写作.pptx
- 人美版美术四年级(上册)8 笔的世界 课件 (1).pptx
- 人美版美术七年级(上册)龙的制作.pptx
- 英语人教PEP版六年级(上册)Unit 2 第一课时.pptx
- 数学苏教版三年级(上册)3.3 长方形和正方形周长的计算 苏教版(共12张PPT).pptx
- 音乐人教版八年级(上册)青春舞曲 课件2.pptx
- 音乐人教版四年级(上册) 第一单元 音乐知识 附点四分音符|人教版.pptx
- 英语人教PEP版四年级(上册)Unit 6 Part B let's learn 1.pptx
- 道德与法治人教版二年级(上册)课件-3.11大家排好队部编版(共18张PPT).pptx
- 人美版美术七年级(上册)《黄山天下奇》课件1.pptx
文档评论(0)