基于稀疏自动编码器的微博情感分类应用研究-广西科技大学学报.pdfVIP

基于稀疏自动编码器的微博情感分类应用研究-广西科技大学学报.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于稀疏自动编码器的微博情感分类应用研究-广西科技大学学报

第26卷 第3期 广西科技大学学报 Vol.26 No.3 2015年9月 JOURNALOFGUANGXIUNIVERSITYOFSCIENCEANDTECHNOLOGY Sep.2015 广西科技大学学报 第26卷 文章编号 2095鄄7335渊2015冤03鄄0036鄄05 DOI院10.16375/45-1395/t.2015.03.007 基于稀疏自动编码器的微博情感分类应用研究 秦胜君 (广西科技大学 管理学院, 广西 柳州 545006) 摘 要院微博情感倾向分类是分析微博语句带有正向尧负向或者中性情感.已有的研究大多根据手工标注微博情感极 性进行有监督或半监督分类.该文主要结合了稀疏自动编码器和支持向量机袁自动提取情感特征袁实现了无监督的微 博情感分类.实验结果表明院稀疏自动编码器在微博情感倾向分类精度上基本和手工标注情感特征算法相近袁但是微 博文本形式多变袁自动提取情感特征适应性更强. 关键词院情感分类曰深度学习曰稀疏自动编码器 中图分类号院TP391.3 文献标志码院A 0 引言 [1] 微博是一种基于社交网络的开放性信息传播平台袁是数字信息时代的产物 .根据2014年微博用户发 展报告袁截止2014年9月30 日袁新浪微博的注册用户已经超过了2亿袁月活跃用户数达到1.67亿袁用户每 日的发博量超过1亿.面对微博用户发布的海量信息袁企业可以通过挖掘这些数据以获取用户对某些产品 的评论袁从而根据用户的喜好投放对应的广告[2].另外也可以帮助政府实时关注民众情绪袁避免非理性情绪 [3] 在网络中蔓延袁防止不法分子通过微博平台散布谣言袁破坏社会的稳定与和谐 .因此袁如何分析微博用户 的情感倾向性袁成为了数据挖掘领域中研究的热点. 微博情感倾向分类是指识别用户在微博中所表达的情绪状态袁一般包含正面尧负面或是中性3类情感 倾向.目前袁国内外学者对微博情感分类已经做了不少研究.例如袁MohamedM等[4]使用预定义词汇集对多个 [5] 公司消费者的微博进行情绪分析袁发现消费者对这些公司的产品存在积极的正面情感.卢伟胜等 根据一 个词性序列代表一类文本的特点袁提出了基于词性标注序列的特征提取方法袁从而达到降低特征维度的效 果袁而且证实了分类精度比n-gram特征提取方法提高了9%的分类精度.韩忠明等[6]选择微博中常见的词 汇构成基础词典袁结合词典和语法结构袁提出了一种基于自动机理论的倾向性识别算法.实验表明该算法 [7] 在短文本上具有明显的优势.刘培玉等 在情感词典基础上加入表情符号词典和网络新词袁为微博构建了 专门词典袁同时进行修辞和句式分析袁有效的提高了倾向性分析的效果. 综上所述袁 现有的微博情感倾向分析基本是使用有监督或者半监督算法袁 需要人工提取情感特征.然 而袁对于微博这种开放性的交流平台袁文本具有长度短尧结构复杂尧数据量大以及变化形式较快等特点袁人 工提取特征需要耗费较多的时间和精力.因此袁本文将稀疏自动编码器和支持向量机渊SVM冤结合袁提出一种 自动提取情感特征的情感倾向分类算法.实验表明院该算法在微博情感分类精度上具有一定的优势. 1 算法描述 稀疏自动编码器是在深度自动编码器渊DeepAutoencoders院DAE冤基础上加入了正则限制袁要求每一层 中的节点大部分为0袁少数不为0袁从而形成了稀疏自动编码器.其损失函数和训练方法都和深度自动编码 器相同.因此袁本文在介绍稀疏自动编码器之前袁先阐述深

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档