- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词典与机器学习的中文微博情感分析研究.doc
基于词典与机器学习的中文微博情感分析研究
导读:就爱阅读网友为您分享以下“基于词典与机器学习的中文微博情感分析研究”资讯,希望对您有所帮助,感谢您对92的支持!
第31卷第7期
2014年7月
计算机应用与软件
ComputerApplicationsandSoftware
VoL31No.7
Jul.2014
基于词典与机器学习的中文微博情感分析研究
孙建旺
吕学强张雷瀚
(北京信息科技大学网络文化与数字传播北京市重点实验室北京100101)
摘要随着web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为
特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助sVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。关键词
微博
表情符号
极性值
位置权重
情感分类
中图分类号1粥91.1文献标识码
A
DOI:10.3969/j.issn.1000-386x.2014.07.045
ON
SENT姗NT
ANALYSISOFCH】NESECRoBLoGGING
BASEDoN
LECoN
ANDM_ACH】NE
LEARN矾G
SunJianwangLnXueqiangZhangLeihan
(&彬昭研蹦。删。可o,胁e删c础啪口以D湖口fDke砸删妇n胍∞础,&狮g蜘mm加sc据腑口,ld‰^,lo如gy№沁H蚵,&抗昭』删0J,蕊讹)
Abs仃an
Along访ththerising0fWeb2.0age,thestIldiesrelated
to
Illicroblog百ng
havedmwn埘deattentionsfrombot}ltheacademia柚d
industry
communities.
By
selecting
verbs
锄dadjectivesinmicroblogging
texts
硒
山e
features,
weput
foard
a
hierarchical
stmcture-b鹊edfeaturedimensionalityreductionapproach.Thedesignedemoticon-b∞edmethodisadopted
to
calclllatethefeaturepolarity
value.0ntIlisb鹳is,tllepositionweightcalculationmethodbasedon
feature
pol“tyvalueisproposed.And埘山thehelp0fSVM
as
the
machine
le锄ingmodel,theappmach
classifiesthemicmblo路ingtextsintopositive,negativeandneutralcate90riesseparately.ExperimentaI
resultsshowthatthepmposedapproach
can雒bctivelymakesentimentcl鹊sification
on
Chinesemicmbloggingtexts.
Keywor凼
Microblogging
EmoticonPol撕ty
value
Position
weigllt
sentimentclass击cation
O
引言
微博是一种新的信息发布及社交网络平台。自问世以来,迅速吸引了大众的眼光,得以蓬勃发展。据cNNIc统计显示,截止2011年12月底,我国微博用户数达到2.5亿,较上一年底增长了296.O%,网民使用率为48.7%…。微博消息量大、更新速度快,吸引了大批学者对其进行研究,针对微博的自然语言处理研究已成为一个新的研究热点及前沿性课题,微博情感分析就是其中的一个热点课题。微博情感分析是将微博文本按其主观倾向性将其分为正向、负向和中性三类。
目前,在情感分析方面,主要使用的技术分为两大类:一类是采用情感词典的方法。2J,借助情感词典统计待分析文本中正向情感词和负向情感词的数目,根据他们的差值分析文本的情感极性;另一类是采用机器学习的方法。3J,标注训练语料和测试语料,使用支持向量机、最大熵、KNN等分类器进行情感分类。wangMl等人构建一个Twitter情感分析系统,能够实时地对有关总统选举的评论信息进行情感倾向性分析。
Agarwal¨o等人以词语的极性及其词性为特征,借助树内核模
型对微博文本进行情感分类研究,并取得了一定的成果。JiangMl等人采用主题相关和无关的方式对微博文本进行情感
极性分类,分为正向情感和负向情感。中文微博与英文微
您可能关注的文档
最近下载
- (高清版)B-T 2099.1-2021 家用和类似用途插头插座 第1部分:通用要求.pdf VIP
- 劳动创造美好生活中职生劳动教育全套教学课件.pptx
- 人工智能在高中美术课堂中的应用.pdf
- 西藏自治区日喀则市高一入学数学分班考试真题含答案.docx VIP
- 2025黑龙江省建设投资集团有限公司面向系统内部及社会招聘12人笔试备考试题及答案解析.docx VIP
- 医院医德医风考评公示制度医德医风考评制度及考评实施细则.docx
- 晶体工程资料.pdf VIP
- 成都川师锦华小升初入学分班考试英语考试试题及答案.docx VIP
- 第六章晶体工程.ppt VIP
- ASUS华硕ROG SWIFT PG65UQ中文说明书.pdf VIP
文档评论(0)