基于词典与机器学习的中文微博情感分析研究.docVIP

基于词典与机器学习的中文微博情感分析研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词典与机器学习的中文微博情感分析研究.doc

基于词典与机器学习的中文微博情感分析研究 导读:就爱阅读网友为您分享以下“基于词典与机器学习的中文微博情感分析研究”资讯,希望对您有所帮助,感谢您对92的支持! 第31卷第7期 2014年7月 计算机应用与软件 ComputerApplicationsandSoftware VoL31No.7 Jul.2014 基于词典与机器学习的中文微博情感分析研究 孙建旺 吕学强张雷瀚 (北京信息科技大学网络文化与数字传播北京市重点实验室北京100101) 摘要随着web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为 特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助sVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。关键词 微博 表情符号 极性值 位置权重 情感分类 中图分类号1粥91.1文献标识码 A DOI:10.3969/j.issn.1000-386x.2014.07.045 ON SENT姗NT ANALYSISOFCH】NESECRoBLoGGING BASEDoN LECoN ANDM_ACH】NE LEARN矾G SunJianwangLnXueqiangZhangLeihan (&彬昭研蹦。删。可o,胁e删c础啪口以D湖口fDke砸删妇n胍∞础,&狮g蜘mm加sc据腑口,ld‰^,lo如gy№沁H蚵,&抗昭』删0J,蕊讹) Abs仃an Along访ththerising0fWeb2.0age,thestIldiesrelated to Illicroblog百ng havedmwn埘deattentionsfrombot}ltheacademia柚d industry communities. By selecting verbs 锄dadjectivesinmicroblogging texts 硒 山e features, weput foard a hierarchical stmcture-b鹊edfeaturedimensionalityreductionapproach.Thedesignedemoticon-b∞edmethodisadopted to calclllatethefeaturepolarity value.0ntIlisb鹳is,tllepositionweightcalculationmethodbasedon feature pol“tyvalueisproposed.And埘山thehelp0fSVM as the machine le锄ingmodel,theappmach classifiesthemicmblo路ingtextsintopositive,negativeandneutralcate90riesseparately.ExperimentaI resultsshowthatthepmposedapproach can雒bctivelymakesentimentcl鹊sification on Chinesemicmbloggingtexts. Keywor凼 Microblogging EmoticonPol撕ty value Position weigllt sentimentclass击cation O 引言 微博是一种新的信息发布及社交网络平台。自问世以来,迅速吸引了大众的眼光,得以蓬勃发展。据cNNIc统计显示,截止2011年12月底,我国微博用户数达到2.5亿,较上一年底增长了296.O%,网民使用率为48.7%…。微博消息量大、更新速度快,吸引了大批学者对其进行研究,针对微博的自然语言处理研究已成为一个新的研究热点及前沿性课题,微博情感分析就是其中的一个热点课题。微博情感分析是将微博文本按其主观倾向性将其分为正向、负向和中性三类。 目前,在情感分析方面,主要使用的技术分为两大类:一类是采用情感词典的方法。2J,借助情感词典统计待分析文本中正向情感词和负向情感词的数目,根据他们的差值分析文本的情感极性;另一类是采用机器学习的方法。3J,标注训练语料和测试语料,使用支持向量机、最大熵、KNN等分类器进行情感分类。wangMl等人构建一个Twitter情感分析系统,能够实时地对有关总统选举的评论信息进行情感倾向性分析。 Agarwal¨o等人以词语的极性及其词性为特征,借助树内核模 型对微博文本进行情感分类研究,并取得了一定的成果。JiangMl等人采用主题相关和无关的方式对微博文本进行情感 极性分类,分为正向情感和负向情感。中文微博与英文微

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档