- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义特征文本情感倾向识别研究
基于语义特征文本情感倾向识别研究
摘 要:由于网络评论用语的多样性,常用的文本主题分类方法并不能完全适应情感倾向识别。针对这个问题,从语义理解的角度出发,提出一种基于语义特征的情感倾向识别方法,通过增加语义特征使得原始文本表现出更加明确的情感倾向,并且更加容易区分。实验结果表明了该方法的有效性。
关键词:语义特征; 倾向识别; 情感分类; 主题分类
中图法分类号:TP309.7 文献标志码:A
文章编号:1001-3695(2010)03-0992-03
doi:10.3969/j.issn.1001-3695.2010.03.050
Text sentiment orientation identification based on semantic feature
HE Kun, LI Wei-sheng, YANG Yong
(Institute of Computer Science Technology, Chongqing University of Posts Telecommunications, Chongqing 400065, China)
Abstract:Because of the diversity of network comments, common method of text topic classification can not completely adapt to the orientation identification. To solve this problem,this paper proposed a method of text orientation identification based on semantic feature from the point of view of semantic understanding. Expressed sentiment orientation of original text definitely and distinguished original text more precisely than that without semantic feature because of increasing semantic feature. The experimental results indicate the validity of the method.
Key words:semantic feature; orientation identification; emotion classification; topic classification
0 引言
互联网逐渐成为人们生活不可或缺的一部分,随之而兴起的Web已经成为网民发表个人见解的最常用载体。网络评论反映了网民对热点事件的观点,体现了网民兴趣所在,对于网络评论进行挖掘和分析,识别出其情感倾向,可以更好地分析热点舆情,理解用户的兴趣爱好,给政府和企业提供重要的参考信息。
对于文本情感倾向的挖掘,Turney[1]提出一种基于情感词组的分类方法,通过计算待定词与七对褒贬倾向强烈的词的逐点互信息(pointwise mutual information)来判断待定词的情感倾向性。Pang Bo等人[2]利用机器学习的方法,采用na?ve Baye-sian对由两个类别组成的电影评论进行分类,取得了较好的分类效果。Hu等人[3]采用一种基于频繁模式挖掘的方法,即在大量的产品评论中找到产品名,再在评论中查找产品名周围相关的情感词,识别评论的情感倾向。王素格等人[4]用多种特征选择方法,对语料使用不同词性的停用词表进行了比较实验,得出了形容词、副词、动词对情感倾向识别的影响较大的结论。徐琳宏等人[5]利用知网中义原标注为良和莠的词作为基准词,利用刘群等人[6]的义原相似度公式计算语料中的待定词汇与基准词之间的相似度,从而得出待定词的褒贬倾向度。最后将选出的倾向度明显的词作为特征,用支持向量机进行分类,取得一定识别效果。本文在主题分类的基础上,通过考察文本中情感倾向的独特表达方式,提出了一种基于语义特征的情感分类方法。
1 文本的主题分类方法及其用于情感分类的不足
1.1 主题分类框架
本文的情感分类采用一般主题分类的框架,主要分为预处理、特征选择和文档表示等步骤。
1.1.1 预处理
王素格等人[4]的实验表明,采用形容词、副词、动词进行情感分类的效果较好。本文根据王素格的结论设立停用词表,对原始语料进行停用
您可能关注的文档
最近下载
- 求阴影面积的常用方法.pdf VIP
- 2024年广东省深圳市盐田区梅沙街道招聘社区工作者真题含答案详解.docx VIP
- 英、美、中三国会计师事务所组织形式演变研究.pdf VIP
- 工会经费管理与内部审计问题分析及改进建议.docx VIP
- 电气管理课件.pptx VIP
- 2025中国现代文学史自考真题及答案 .pdf VIP
- 2025努力锻造忠诚干净担当的新时代政法铁军党课PPT课件.pptx VIP
- 富士达电梯MLVF-T无机房(CP40)电气原理图.pdf VIP
- 国家建筑标准设计图集-12S101 矩形给水箱.pdf VIP
- Pico Pico Neo 3 VR头盔 Pico Neo 3 0207 用户手册.pdf
文档评论(0)