主客观与褒贬分类融合微博情感倾向性分析.docVIP

  • 4
  • 0
  • 约8.1千字
  • 约 13页
  • 2018-08-15 发布于福建
  • 举报

主客观与褒贬分类融合微博情感倾向性分析.doc

主客观与褒贬分类融合微博情感倾向性分析

主客观与褒贬分类融合的微博情感倾向性分析   摘 要:在微博情感倾向性分析中,一种典型分析方法是先对微博进行主客观分类,再对判定为主观的微博进行褒贬分类,但其问题在于主客观分类错误将直接传导到褒贬分类。针对这一问题,本文提出了一个主客观分类和褒贬分类融合的评估情感倾向性强度的模型。首先使用改进的逻辑回归模型构建主客观分类模型,并结合情感词典构建褒贬分类模型;然后,将二者融合,构建情感倾向性强度模型来选出具有较强情感的微博;最后应用褒贬分类模型判定情感倾向性。该方法在第六届中文倾向性分析评测(COAE2014)的微博观点句识别任务中获得了主要指标Micro_F1值和Macro_F1值的第二名。   关键词:情感倾向性分析;主客观分类;褒贬分类;微博   中图分类号:TP391.1 文献标识码:A 文章编号:2095-2163(2014)06-   Abstract: A typical practice in sentiment analysis consists of two steps: first classify the subjective sentences from the objective ones, and then distinguish the positives from the negatives among the subjective sentences. To alleviate the issue of error accumulation arising from such a pipeline approach, this paper investigates a unified model for microblog sentiment analysis. Firstly, a subjective-objective classification model is constructed by the improved Logistic Regression model. And a positive-negative classification model is proposed by using sentiment dictionary and the improved Logistic Regression. Secondly, an emotional intensity model, which is a linear combination of the two classification sub-models, is applied to select the microblogs with more strong sentiment. Lastly, the sentiment classification is judged by the positive-negative classification model. The final release of COAE 2014 indicates that the proposed method ranks as top 2 in micro_F1 and macro_F1 in the task.   Keywords: Sentiment Tendency Analysis; Subjective-Objective Classification; Positive-Negative Classification; Microblog   0引 言   随着微博的不断发展和实用普及,国内外学者围绕微博展开了一系列研究,其中微博情感倾向性分析已然成为研究热点之一。微博情感分析即是对带有情感色彩的主观性微博进行分析、处理、归纳和推理,就是通过对微博情感信息的综合计算和技术评定,藉此实现了解人们针对实体、人物、事件、主题及其属性的主观意见和对应情感的研究宗旨[1]。微博的情感分析在挖掘用户观点、产品反馈、商品推荐、潜在用户挖掘等多方面均具较高的应用价值。而且,在理论上,情感分析技术也有助于自然语言处理领域其他研究方向的深度发展,具体来说则如自动文本摘要以及问答系统等[2]。   当前研究中,文本情感分析主要采用了基于情感知识的方法和基于分类的方法[2]。针对此两类方法,可做如下综述和解析。   一方面,基于情感知识的方法可通过考察文本内部是否含有情感知识来完成主客观分析和褒贬分析[3]。这类方法的情感知识主要是通过情感词典、领域词典或主观文本中带有情感极性的组合评价单元而相应获得。例如:文献[4]利用情感词典识别文本中的情感词,文献[5]通过WordNet半自动地构建评价词词典和修饰词词典,文献

文档评论(0)

1亿VIP精品文档

相关文档