非监督式层次话题情感模型在网络评论主题发现中的应用.pdfVIP

非监督式层次话题情感模型在网络评论主题发现中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非监督式层次话题情感模型在网络评论主题发现中的应用.pdf

东 北 石 油 大 学 学 报 第39卷 第1期 2015年2月 JOURNALOFNoRTHEASTPETROLEUMUNIVERSITY V01.39No.1 Feb. 2015 DOI lo.3969/j,issn.2095~4107.2015.01.015 非监督式层次话题情感模型在网络 评论主题发现中的应用 陈永恒1,姚桂杰2,林耀进1 (1.闽南师范大学计算机学院,福建漳州363000;2.中国石油天然气股份有限公司大港石化分公司,天津300280) 摘要:自动发现话题的隐含结构、情感的极性及其关系,可以方便用户从海量网络评论集中快速获得他们关注的 Level 主要观点.提出一种基于非监督式的层次话题的情感(UnsupervisedAspec卜Sentiment,uLAS)模型,利用贝叶斯非 参数性模型作为先验知识,实现非监督式发现未标记评论文本集话题的层次结构,分析层次话题的情感极性.实验结果 表明,相比传统的JsT和AsuM模型.uLAs模型具备较高的分类精确度和较强的模型泛化能力,能够解决传统话题情 感模型只能在单一粒度话题层进行情感分析的问题,实现多粒度话题层的情感分析,满足用户对于评论对象不同粒度话 题的情感信息需求. 关键词:非监督式层次话题情感模型;隐藏狄利克雷分配;文本分析;网络评论;主题发现;主题模型;非参贝 叶斯模型 中图分类号:TPl81;TP301.2文献标识码:A 文章编号:2095—4107(2015)01一0112—06 0 引言 网络评论文本集中隐含产品话题及消费者情感极性信息,如在笔记本电脑的评论信息中,一般包含笔 记本电脑的质量、电池、屏幕及CPU等比较集中的话题信息.在购买笔记本电脑前,消费者希望通过查看 其他用户的评论信息,了解产品各话题的情感信息,主要包括产品是否值得购买及产品各话题信息的情感 倾向等.面对海量且无结构化的网络评论信息,人们难以获得准确的产品特征情感信息一1|.近年来,作为非 结构化信息挖掘的一个新兴领域——网络评论的挖掘受到人们关注[2]. 大部分网络评论挖掘研究忽视话题情感的层次结构,但不论是从消费者还是从技术角度,话题情感的 层次结构对于网络评论挖掘具有重要作用:(1)从消费者角度分析,不同消费者需要不同粒度的话题情感 信息,如有些消费者比较关注屏幕和CPu等较粗粒度的话题信息,有些消费者比较关注cPU主频和 Cache缓存等较细粒度的话题信息.传统的话题情感模型只能进行单一粒度层的话题情感分析,不能满足 所有消费者对不同粒度层话题的情感信息需求,而且消费者需要具有层次结构的话题和情感,找到关注的 话题及情感评论.(2)从技术角度分析,层次结构的话题和情感便于情感分析.情感词的识别对于情感分析 的精确性非常重要,但不同情感词在表达不同话题时,呈现不同的情感极性[3],如情感词“快”,在CPU话 题的评论中具有褒义情感极性,在电池话题的评论中具有贬义情感极性,该问题在基于话题的情感分析模 型、尤其是非监督模型中常常难以处理.此外,具有明显情感极性但不依赖话题的一般情感词,如“好”、 “坏”等,对话题的情感评价作用非常有限[z].现有非监督模型通过分析一般情感词在某段文本中的共现统 计,将一般情感词的极性传递给话题情感词,但当一般情感词在话题中出现数量非常少时,一般情感词的 极性难以传递给话题情感词[4].根据发现话题及情感极性的层次结构,情感极性可以沿着从一般到特殊的 路径传递,进而能够发现准确表达话题情感的情感极性词. 目前,缺少利用话题的层次结构信息实现不同粒度层话题的情感分析的相关文献.笔者提出一种非监 Level 督式层次话题情感(Unsupervised 收稿日期:2014—12—23;编辑:张兆虹 基金项目:国家自然科学基金项目60973040;福建省教育厅科技A类项目(JAl3196) 作者简介:陈永恒(1980一),男,博士,副教授,主要从事机器学习、数据挖掘和推荐系统方面的研究. · · 11

文档评论(0)

kfigrmnm + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档