- 10
- 0
- 约2.41万字
- 约 8页
- 2018-12-20 发布于天津
- 举报
一种基于连接关系的中文情感词典构建方法-计算语言学.PDF
文章编号:1003-0077 (2011 )00-0000-00
一种基于连接关系的中文情感词典构建方法
王科 夏睿
(南京理工大学 计算机科学与工程学院,江苏 南京210094)
摘 要: 社交媒体及电子商务网站评论的兴起促进了文本情感分析的发展。其中,情感词典构建是文本情感
分析的重要内容,然而现有的通用情感词典和词典构建方法,具有领域适用性问题,且不能处理一词多情
感。本文提出的方法,利用转折词和否定词对文本极性造成的翻转,将语料中的情感词进行极性分类。实
验结果显示,我们的方法能够有效构造领域特定的中文情感词典,与现有的通用情感词典和常见的情感词
典构建方法相比,本文方法在篇章级、属性级文本情感分析上表现出了更好的性能。
关键词: 情感分析;情感词典;连接关系
中图分类号:TP391 文献标识码:A
An Approach to Chinese Sentiment Lexicon Construction Based on Conjunction Relation
Ke Wang Rui Xia
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094 Jiangsu)
Abstract: The rise of Internet reviews in social media and e-commerce sites promotes the development of text
sentiment analysis.Sentiment lexicon is an important part of sentiment analysis. However, the existing common
sentiment lexicons and construction methods have applicability problems in the area, and they still can ’t handle
the words with one more sentiment. This paper presents a construction method that utilize transition words and
negative words to classify the sentiment words in corpus, as these words can reverse the polarity of text.
Experimental results show that our method can effectively construct domain specific Chinese sentiment lexicon,
and has a better performance compared to existing common sentiment lexicon and construction methods in the
chapter level, attribute-level text sentiment analysis.
Key words: sentiment analysis; sentiment lexicon; conjunction relation
资源也相对较少,现有的通用情感词典和构建方
1.引言
法存在诸多问题。首先,单词的情感极性受诸多
随着互联网的迅速发展,尤其是以微博、论 因素影响,同一个词的不同释义可能具有相反的
坛、电子商务网站为代表的网络平台的发展,越 情感极性,比如“我为你骄傲”和“你太骄傲了”
来越多的用户倾向于在网上发表自己对产品或热 中的两个 “骄傲”,
原创力文档

文档评论(0)