- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HNC理论的文本情感倾向性分析-ChinaXiv.PDF
总第8 期 2017 年 第8 期
基于HNC 理论的文本情感倾向性分析*
高 歌 罗珺玫 王 宇
(大连理工大学管理与经济学部 大连 116024)
摘要: 【目的 】构建一种更加科学、准确的评论文本情感倾向性分析方法, 解决网络新词难于计算的问题。【方
法 】利用概念层次网络(HNC)理论的符号对偶性计算情感值, 根据建立的规则为新词确定符号, 利用符号重用降
低工作量, 实现对新词的处理。【结果 】通过对已有成果的分析和改进, 最终得到一套较为完善的情感倾向性分
析方法, 并使用真实数据进行实验, 验证了该方法的可行性, 同时也发现了待改进之处。【局限 】目前仅能对网
络短文本进行分析, 且新词的加入需采用人工标注的方式。【结论 】本文方法可行有效, 为文本情感分析提供了
新思路。
1
v 关键词: 评论文本 情感分析 概念层次网络(HNC)
7 分类号: TP391
7
3
1
0. 1 引 言 HowNet 的词汇语义倾向计算, 提出基于语义相似度
2 的方法和基于语义相关场的方法; 聂卉等[3] 基于
1
7 随着互联网的发展和Web2.0 的提出, 网络数据不 HowNet, 提出面向评论效用评估的文本情感特征提
1 再仅仅包含结构化、标准化的内容。电子商务网站的 取方法; 兰秋军等[4]使用依存句法分析的方法计算金
0 兴起和微博、知乎等社区的发展使得用户生成内容 融论坛文本情感倾向性; 何跃等[5]结合话题相关性,
2
: (User Generated Content, UGC)数量突增。文本分析正 利用基于机器学习改进的情感分类方法对抽取博文的
v
i 是针对这一问题诞生的, 本文主要关注文本的情感分 情感极性进行分析; 钟义信[6]提出自然语言理解的全
X 析。在对电子商务平台的用户评论分析和微博等社区 信息方法论; 樊康新[7]提出计算词语情感值的方法。以
a
n 的舆情控制上, 文本情感分析的应用十分广泛。然而 上方法的不足之处是对于文本情感的理解仍是依赖词
i
h 文本情感分析也遇到了诸多难点, 通过词形理解概念 形进行处理的, 这与人理解文本的过程不一致, 因此
c 的方法需要强大的字词库支持, 而字词本身以及字词 会造成较大的工作量和误差, 而且这种方法对于知识
的含义又会随着人们的使用发生变化。种种问题导致 库的完整性要求较高, 对于网络新词、不规范的词语
文本情感分析不可能形成一种通用的、规范的方法。 更是无法处理。刘玮楠[8]则利用 HNC 理论, 从 HNC
本文主要从中文文本入手, 试图摆脱词形的困扰, 深 知识库符号入手实现情感值的计算, 试图通过文本向
入到概念层, 解析中文文本中包含的褒贬情感, 实现 符号的转换来解决对知识库依赖性过高的问题, 但仍
情感值量化的计算。 然是简单地从词形转换到符号上, 计算过程没有本质
在中文文本情感分析中, 薛丽敏等[1]采用五元模 改变。
型进行分析, 即从情感倾向性观点的持有者、倾向性 本文以 HNC 理论[9]为基础, 利用 HNC 理论中概
念层次[10] [11]
的来源、倾向性的指向、倾向性的立场和倾向性的种 和对偶性 原理, 对文本分析不是从形式上
类刻画中文文本情感倾向性; 朱嫣岚等[2]使用基于 入手, 而是注重其概念的表达, 这与人在理解文本内
通讯作者:
文档评论(0)