面向中文微博的情感分类方法研究-计算机应用技术专业毕业论文.docxVIP

面向中文微博的情感分类方法研究-计算机应用技术专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I I 面向中文微博的情感分类方法研究 中文摘要 面向中文微博的情感分类方法研究 中文摘要 近年来,微型博客(简称微博)越来越受到网络用户的青睐,成千上万的用户通 过发布微博共享他们的观点和情感。其中,有大量带有情感倾向(认为某事物“好” 或“坏”)的微博文本,这些微博文本反映了微博作者的情绪。一方面,微博渐渐成 为研究意见挖掘和情感分析非常宝贵的意见资源;另一方面,微博也为意见挖掘和情 感分析提出了新的要求和挑战。本文通过对新浪微博(目前最大的中文微博平台)文 本进行情感信息方面的分析与研究,从以下两个方面对微博文本情感分类展开研究: 首先,本文提出了一种基于情绪知识的非监督情感分类方法。该方法利用情绪词 和情绪图片两种情绪知识对大规模微博非标注语料进行筛选并自动标注,然后用自动 标注好的语料作为训练集构建微博情感文本分类器,用以对微博文本进行情感极性自 动分类。实验结果表明,我们提出的方法在微博文本的情感极性分类方面取得了较好 的效果。 其次,本文通过对新浪微博上股票投资者发布的文本进行情感信息方面的分析与 研究,提出了一种自动识别股票投资者未来情感倾向(认为股票市场未来行情“好” 或“坏”)的方法。股票投资者未来情感倾向反应了股票投资者的情绪(Investor Sentiment),投资者情绪是研究经济市场走向的重要指标,行为金融学认为股票投资 者情绪影响投资者决策,进而影响股票市场。本文提出的分类方法分为两级识别,第 一级:识别出微博中包含未来情感的句子;第二级:将第一级识别出来的包含未来情 感的句子分为正面评论(看涨)和负面评论(看跌)。实验结果表明,本文提出的方 法同样取得了较好的效果。 关键词:中文信息处理;微博;情感分类;情绪知识;投资者情绪 作 者:庞 磊 指导老师:周国栋 李寿山 II II Sentiment Classification on Chinese Micro-blog Abstract Sentiment Classification on Chinese Micro-blog Abstract Recently, Micro-blog has attracted more and more interests of internet users. Thousands of the users share their views and opinions through micro-blog. There are a large number of texts with sentiment orientation (thinking something is “good” or “bad”) on the Micro-blog. These texts reflect the authors’ emotion. On one side, micro-blog has become a very valuable resource of research on the opinion mining and sentiment analysis; On the other side, miro-blog posesses new requirement and challenges for sentiment analysis. In this paper, we research and analysis of these sentiment information texts on Sina micro-blog (Currently, the largest Chinese micro-blog platform). Then, we will research on sentiment classification on Micro-blog from the following two aspects: First, we propose an unsupervised classification method and apply it to perform sentiment classification on Sina micro-blog. Specifically, our approach first employ emotional images and emotional words as the emotional knowledge to extract pseudo-labeled samples, then use them to train a classifier for automatically classification on polarities

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档