- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVMCRF多特征组合微博情感分析优秀参考文档.pdf
第32卷第4期 计 算 机 应 用 研 究 V0J.32No.4
2015年 4月 ApplicationResearchofComputem Apr.2015
基于 SVM和 CRF多特征组合的微博情感分析术
李婷婷 ,姬东鸿
(武汉大学计算机学院,武汉430000)
摘 要 :近年来,文本的情感分析一直都是 自然语言处理领域所研究的热点问题 ;微博作为一种短文本 ,用词精
炼而简洁,富含观点、倾 向和态度。因此,识别微博的情感倾 向具有重要的现实意义。提出一种基于 SVM和
CRF的情感分析方法,使用多种文本特征,包括词、词性、情感词、否定词、程度副词和特殊符号等,并选用不同的
特征组合,通过多组实验使情感分析效果最优 。实验显示,选用词性、情感词和否定词的特征组合时,SVM模型
的正确率达到88.72%,选用情感词、否定词、程度副词和特殊符号的特征组合时,CRF模型的正确率达到
90.44% 。
关键词:微博;情感分析;支持向量机;条件随机场
中图分类号 :TP391.1 文献标志码 :A 文章编号 :1001—3695(2015)04—0978—04
doi:10.3969/j.issn.1001—3695.2015.04.004
Sentimentanalysisofmicro-blogbasedonSVM and
CRFusingvariouscombinationsoffeatures
LITing—ring,JIDong—hong
(SchoolofCompeer,WuhanUniversity,Wuhan430000,China)
Abstract:Inrecentyears,thetextsentimentanalysishasalwaysbeenahotissueinthefieldofnaturallanguageprocessing.
Asash0ntext.micro—blogiSfeaturedofrefinedandconcise,richinviews,tendenciesandattitudes.Thas,theidentification
ofemotionaltendencieshasimportantpracticalsignificance.ThispaperproposedamethodofsentimentanalysisbasedonSVM
andCRF,usedvariousfeaturesincludingword,speech,emotionalword,negativeword,adverbofdegreeandspecialsym—
bols.Theydesigneddifferentcombinationsoffeaturestomaketheeffectoptimalthroughmuhiplesetsofexperiments.Theac—
curacyofSVM reached88.72% usingthecombinationofspeech.sentimentword andnegativeword.whileCRF attained
90.44% selectingthecombinationofsentimentWOrd.negativeword.adverbofdegreeandspecialsymbols.
Keywords:micro—blog;sentimentanalysis;SVM ;CRF
应用到中文微博却存在一定的局限性。比如 ,虽然同样是 140
0 引言
字的限制,中文所蕴涵的信息比英文更丰富;中文和英文的语
您可能关注的文档
- 《高等学校化学学报》征稿简则优秀参考文档.pdf
- 不同方案治疗手足外科难愈性伤口疗效评价优秀参考文档.pdf
- 不同长宽比矩形截面高层建筑风荷载研究优秀参考文档.pdf
- 不确定环境下基于供应链金融供应链实体交易决策研究优秀参考文档.pdf
- 丙二腈和氰乙酸酯参3脱氢莽草酸甲酯缩合芳构化环合串联反应优秀参考文档.pdf
- 二苯胺取代吖啶衍生物发光材料合成、表征和电致发光性能优秀参考文档.pdf
- 互相关优化改进矩阵束算法和其在次同步振荡模态参数辨识应用优秀参考文档.pdf
- 从国际经验看利率市场化对我国金融运行影响优秀参考文档.pdf
- 从政府职能转变视角反思社区基本公共服务优秀参考文档.pdf
- 从苏南现代化示范区规划看区域协同创新协调发展优秀参考文档.pdf
文档评论(0)