- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于PMl—IR算法的BIog情感分类研究幸.PDF
基于PMl—I I
R算法的Bog’情感分类研究幸
段秀婷何婷婷宋乐
华中师范大学计算机科学系,湖北武汉430079
E-mail:a1)c38
1858424@163.com;曲e@mail.ccntLedu.cn;
摘要:Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了—种基于PMI—IR算法的
四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本
中的情感要素和背景情感词之问的点互信息值,从而对文本进行情感分类。该方法在国家语言资源监测与研究中
心网络媒体语言分中-心2008年度的Blog语料和COAE2008的语料上分别进行了测试。与传统方法相比准确率和召
回率都有了较大的提高。
关键词:中文信息处理:情感分类:互信息:PMI—IR算法
ResearchonSenti mentCI assi fi cati onofBI Basedon
og
PMl—IR
He,Le
XiutingDuan,TingtingSong
Normal
DepartmentofComputerScience,HuazhongUniversity,Wuhan,430079
E-mail:abc381858424@163.com;曲e@mail.ccnu.edu.cn;
texts tO
informationontheinternethas new Chinesetextclassification.
Abstract:DevelopmentofBIog brought
challenge
Aimto the in methodsfor
semantics traditional Chinesetext
solving deficiencyproblem classification,this
paper
atextclassificationmethodon a
a
implements classifyingblogasjoy,angry,sador/barus/ng unsupervisedlearning
simple
classificationtextis maxsemantic text
the inthe
algorithm.The ofa.blog predictedby orientation(SO)ofthephrasesblog
that oradverbs.Inthis as
原创力文档


文档评论(0)