基于HNC理论的文本情感倾向性分析-ChinaXiv.PDFVIP

基于HNC理论的文本情感倾向性分析-ChinaXiv.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HNC理论的文本情感倾向性分析-ChinaXiv.PDF

总第8 期 2017 年 第8 期 基于HNC 理论的文本情感倾向性分析* 高 歌 罗珺玫 王 宇 (大连理工大学管理与经济学部 大连 116024) 摘要: 【目的 】构建一种更加科学、准确的评论文本情感倾向性分析方法, 解决网络新词难于计算的问题。【方 法 】利用概念层次网络(HNC)理论的符号对偶性计算情感值, 根据建立的规则为新词确定符号, 利用符号重用降 低工作量, 实现对新词的处理。【结果 】通过对已有成果的分析和改进, 最终得到一套较为完善的情感倾向性分 析方法, 并使用真实数据进行实验, 验证了该方法的可行性, 同时也发现了待改进之处。【局限 】目前仅能对网 络短文本进行分析, 且新词的加入需采用人工标注的方式。【结论 】本文方法可行有效, 为文本情感分析提供了 新思路。 1 v 关键词: 评论文本 情感分析 概念层次网络(HNC) 7 分类号: TP391 7 3 1 0. 1 引 言 HowNet 的词汇语义倾向计算, 提出基于语义相似度 2 的方法和基于语义相关场的方法; 聂卉等[3] 基于 1 7 随着互联网的发展和Web2.0 的提出, 网络数据不 HowNet, 提出面向评论效用评估的文本情感特征提 1 再仅仅包含结构化、标准化的内容。电子商务网站的 取方法; 兰秋军等[4]使用依存句法分析的方法计算金 0 兴起和微博、知乎等社区的发展使得用户生成内容 融论坛文本情感倾向性; 何跃等[5]结合话题相关性, 2 : (User Generated Content, UGC)数量突增。文本分析正 利用基于机器学习改进的情感分类方法对抽取博文的 v i 是针对这一问题诞生的, 本文主要关注文本的情感分 情感极性进行分析; 钟义信[6]提出自然语言理解的全 X 析。在对电子商务平台的用户评论分析和微博等社区 信息方法论; 樊康新[7]提出计算词语情感值的方法。以 a n 的舆情控制上, 文本情感分析的应用十分广泛。然而 上方法的不足之处是对于文本情感的理解仍是依赖词 i h 文本情感分析也遇到了诸多难点, 通过词形理解概念 形进行处理的, 这与人理解文本的过程不一致, 因此 c 的方法需要强大的字词库支持, 而字词本身以及字词 会造成较大的工作量和误差, 而且这种方法对于知识 的含义又会随着人们的使用发生变化。种种问题导致 库的完整性要求较高, 对于网络新词、不规范的词语 文本情感分析不可能形成一种通用的、规范的方法。 更是无法处理。刘玮楠[8]则利用 HNC 理论, 从 HNC 本文主要从中文文本入手, 试图摆脱词形的困扰, 深 知识库符号入手实现情感值的计算, 试图通过文本向 入到概念层, 解析中文文本中包含的褒贬情感, 实现 符号的转换来解决对知识库依赖性过高的问题, 但仍 情感值量化的计算。 然是简单地从词形转换到符号上, 计算过程没有本质 在中文文本情感分析中, 薛丽敏等[1]采用五元模 改变。 型进行分析, 即从情感倾向性观点的持有者、倾向性 本文以 HNC 理论[9]为基础, 利用 HNC 理论中概 念层次[10] [11] 的来源、倾向性的指向、倾向性的立场和倾向性的种 和对偶性 原理, 对文本分析不是从形式上 类刻画中文文本情感倾向性; 朱嫣岚等[2]使用基于 入手, 而是注重其概念的表达, 这与人在理解文本内 通讯作者:

文档评论(0)

sunguohong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档