- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于稀疏自动编码器的微博情感分类应用研究-广西科技大学学报
第26卷 第3期 广西科技大学学报 Vol.26 No.3
2015年9月 JOURNALOFGUANGXIUNIVERSITYOFSCIENCEANDTECHNOLOGY Sep.2015
广西科技大学学报 第26卷
文章编号 2095鄄7335渊2015冤03鄄0036鄄05 DOI院10.16375/45-1395/t.2015.03.007
基于稀疏自动编码器的微博情感分类应用研究
秦胜君
(广西科技大学 管理学院, 广西 柳州 545006)
摘 要院微博情感倾向分类是分析微博语句带有正向尧负向或者中性情感.已有的研究大多根据手工标注微博情感极
性进行有监督或半监督分类.该文主要结合了稀疏自动编码器和支持向量机袁自动提取情感特征袁实现了无监督的微
博情感分类.实验结果表明院稀疏自动编码器在微博情感倾向分类精度上基本和手工标注情感特征算法相近袁但是微
博文本形式多变袁自动提取情感特征适应性更强.
关键词院情感分类曰深度学习曰稀疏自动编码器
中图分类号院TP391.3 文献标志码院A
0 引言
[1]
微博是一种基于社交网络的开放性信息传播平台袁是数字信息时代的产物 .根据2014年微博用户发
展报告袁截止2014年9月30 日袁新浪微博的注册用户已经超过了2亿袁月活跃用户数达到1.67亿袁用户每
日的发博量超过1亿.面对微博用户发布的海量信息袁企业可以通过挖掘这些数据以获取用户对某些产品
的评论袁从而根据用户的喜好投放对应的广告[2].另外也可以帮助政府实时关注民众情绪袁避免非理性情绪
[3]
在网络中蔓延袁防止不法分子通过微博平台散布谣言袁破坏社会的稳定与和谐 .因此袁如何分析微博用户
的情感倾向性袁成为了数据挖掘领域中研究的热点.
微博情感倾向分类是指识别用户在微博中所表达的情绪状态袁一般包含正面尧负面或是中性3类情感
倾向.目前袁国内外学者对微博情感分类已经做了不少研究.例如袁MohamedM等[4]使用预定义词汇集对多个
[5]
公司消费者的微博进行情绪分析袁发现消费者对这些公司的产品存在积极的正面情感.卢伟胜等 根据一
个词性序列代表一类文本的特点袁提出了基于词性标注序列的特征提取方法袁从而达到降低特征维度的效
果袁而且证实了分类精度比n-gram特征提取方法提高了9%的分类精度.韩忠明等[6]选择微博中常见的词
汇构成基础词典袁结合词典和语法结构袁提出了一种基于自动机理论的倾向性识别算法.实验表明该算法
[7]
在短文本上具有明显的优势.刘培玉等 在情感词典基础上加入表情符号词典和网络新词袁为微博构建了
专门词典袁同时进行修辞和句式分析袁有效的提高了倾向性分析的效果.
综上所述袁 现有的微博情感倾向分析基本是使用有监督或者半监督算法袁 需要人工提取情感特征.然
而袁对于微博这种开放性的交流平台袁文本具有长度短尧结构复杂尧数据量大以及变化形式较快等特点袁人
工提取特征需要耗费较多的时间和精力.因此袁本文将稀疏自动编码器和支持向量机渊SVM冤结合袁提出一种
自动提取情感特征的情感倾向分类算法.实验表明院该算法在微博情感分类精度上具有一定的优势.
1 算法描述
稀疏自动编码器是在深度自动编码器渊DeepAutoencoders院DAE冤基础上加入了正则限制袁要求每一层
中的节点大部分为0袁少数不为0袁从而形成了稀疏自动编码器.其损失函数和训练方法都和深度自动编码
器相同.因此袁本文在介绍稀疏自动编码器之前袁先阐述深
您可能关注的文档
- 犌犪荦犎犈犕犜器件22元件小信号模型.pdf
- 家族性牙釉质发育不全症之突变分析cdj-26.pdf
- 家庭烹调对鲟鱼中脂肪酸和胆固醇的影响.pdf
- 家禽养殖过程中弯曲菌流行病学的研究进展-食品安全质量检测学报.pdf
- 家禽饲料加工与营养之间的相互关系-美国大豆协会.pdf
- 家鸽caveolin-1基因全长cdna的克隆序列和组织表达分析.pdf
- 家蚕幼虫全蚕粉的营养成分差异性分析-陕西农业科学.pdf
- 加速度传感器的选择.pdf
- 加速抗药性病原群体的形成.ppt
- 加强审计立项和基础工作管理-宁波财政税务局.doc
- 基于系统动力学的校园碳收支测算模型及应用-上海交通大学学报.pdf
- 基于稀疏编码金字塔模型的农田害虫图像识别-ingentaconnect.pdf
- 基于稀疏编码和随机森林的多帧图像超分辨率算法-电子设计工程.pdf
- 基于物品的协同过滤算法itemcf-百卓.doc
- 基于无限因子; markov模型的旋转机械故障识别方法 - 失效分析与预防.pdf
- 基于无功功率模型的异步电机矢量控制系统转子时间常数辨识.pdf
- 基于稀疏自编码器的烟叶成熟度分类-烟草科技.pdf
- 基于无网格稳定化方案求解非稳态强对流问题的自适应-计算力学学报.pdf
- 基于问题分组讨论法的概率论与数理统计课程改革方案.doc
- 基于五次谐波和小波重构能量的配电网单相接地故障的选-电测与仪表.doc
最近下载
- 2025年医疗资源均衡配置政策对公共卫生服务的提升作用.docx
- 地质建模软件:Surpac二次开发_(22).地质建模质量控制与验证.docx VIP
- 个人授信及担保协议.doc
- 汽车电子电磁兼容emc标准分析资料精.pdf VIP
- 湖南省部分学校2024-2025学年高一上学期期末考试物理试卷(原卷版及答案).docx VIP
- 最新宝宝填色涂色本(精排WORD打印版).doc VIP
- 地质建模软件:Surpac二次开发_(5).三维地质建模技术.docx VIP
- JJF 1554-2015 旋进旋涡流量计型式评价大纲.pdf
- 侧柏公益林质量精准提升技术规程.docx VIP
- 餐具清洁小能手教案.docx VIP
文档评论(0)