文本观点挖掘和情感分析研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文本观点挖掘和情感分析研究

文本观点挖掘和情感分析研究   摘要:观点挖掘和情感分析是分析用户观点,反馈,情感,评估,态度和个人情感的一个研究领域。这是自然语言处理中最活跃的一个研究领域,在数据挖掘,Web挖掘和文本挖掘领域中同样也被广泛研究。随着社交媒体、Web2.0技术(如新闻、论坛、博客、微博和社交网络)的发展,情感分析的重要性相应增长。首次在人类历史上,我们有了大量的数字形式的观点意见需要进行分析。在本文中,我们对文本观点挖掘、情感分析以及相关技术进行了研究。   关键词:观点抽取;观点挖掘;情感分析;文本挖掘   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)05-0235-03   Abstract: Opinion mining and sentiment analysis is the field to analyzes the user point of view, feedback, emotion, sentiment, evaluations, attitudes, and emotions. This is one of the most active research areas in Natural Language Processing. Data mining, web mining and text mining have also been widely studied. With the development of social media, Web2.0 Technology (such as news, forum, blog, micro-blog and social network), the importance of sentiment analysis growth. For the first time in human history, we have to analyze a large number of opinions in digital form. In this paper, we research on text opinion mining, sentiment analysis and related technology.   Key words: Opinion extraction; Opinion mining;Sentiment analysis;Text mining   1 概述   在过去的十五年里,作为情感计算和自然语言处理(NLP)的子任务,关于主观性和情感分析(SSA)的自动化处理研究已经有了蓬勃的发展。社交网络的诞生并飞速发展使得在世界各地的人们可以随时分享、评论或讨论任何话题成为了可能。在这种情况下,社会媒体文本中表达的意见、情绪和情感已被证明是有一个对全球社会和经济具有较高影响力的行为。SSA系统对许多现实世界的应用高度相关(如市场营销,电子管理,商业智能,社会分析),并在自然语言处理(NLP)的许多领域,例如信息抽取、问答、文本含义等。近十年来,已经有大量的相关研究方法和成果,以及由这项技术创建的应用,这些都足以证明这一领域的重要性。尽管已经有大量的资源和方法去处理情感分析[1],但SSA依然是一个亟待解决的问题。   2 情感分析研究的难点   情感分析文本可以看作是积极的,消极的或者其他客观的分类,因此它能够作为文本分类任务。由于文本有很多不同主题,因此它也可以被分为多种种类,但是情感分析只有三种分类。然而,有很多因素使得情感分析比传统的文本分类要难的多。   1)域依赖:观点挖掘和情感分析[2]面临的最大的挑战是情感词的从属域的性质。一个特征集可能在一个领域会有很好的性能,同时它在其他一些领域性能又非常差。   2)限制分类过滤:在决定最受欢迎的想法或概念时,分类过滤中有一个限制。为了得到更好的情感分类结果这个限制应该减少。这存在过滤器给无关的意见的风险并且它能够导致情感分类的判断错误。   3)观点挖掘软件可用性不对称:观点挖掘软件非常昂贵,并且当前只有大型企业和政府能够负担得起。它超出了普遍公民的预期,这本应该是所有小到中型企业都可以承受的价格,这样才能让每个人都能从中受益。   4)合并隐式观点和行为数据:对于成功的情感分析,观点词应该和隐式数据结合。隐式数据决定情感词的真实行为。   5)自然语言处理限制:自然语言处理技术在处理一些模棱两可的句子时结果往往不准确。这些也给情感分析造成阻碍。   3 情感分析技术研究   3.1 文章级别的情感分类   这种方法将整个文档作为一个单一的实体,将情感分为积极或消极的或中性的。文章级别的情感分类[3]假定文章对单一目标

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档