- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于基准词的文本情感倾向性研究
摘要:在网络连通世界的今天,网络信息以铺天盖地的方式呈现在人们的面前,在这些海量的网络信息面前,用计算机技术分析网络中大规模的文本情感倾向,在政府的舆情分析和企业的产品评价智能回馈等应用中有着非常巨大的前景。本文采用基于基准词的方法先提取文本中的情感特征词,然后根据TF-IDF模型计算情感特征词在文本中的权重,最后,对所有的情感词进行加权平均,得出整个文本的情感倾向,最后的实验结果表明,使用本文的方法在判断文本情感倾向性分类中效果有明显的提高。
关键词:情感特征词提取;基准词;TF-IDF模型;情感倾向识别
中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)08-1881-03
Research on Semantic Orientation of the Text Based on the Key-words
ZHANG Bin, YANG Zhi-xiao
(Henan University of Technology,College of Information Science and Engineering, Zhengzhou 450001, China)
Abstract:Today, The whole world is linked by the Internet. network information is presented in a way overwhelming in front of people, in the face of these vast amounts of network information, network with computer technology, large-scale analysis of the text of emotional tendencies in the governments public opinion analysis and evaluation of enterprise products Applications such as intelligent feedback has a very great future. In this paper, dopts the method based on the key-words for extractinghe emotional features in the text,and then on the TF-IDF model emotional features of the word weight in the text,finally on all of the emotions the weighted average, we can obtain the entire text of the emotional tendencies, The experiment results show that the method used in determining the text of this emotional bias classification results significantly improved.
Key words: sentiment words extraction; key-words ; TF-IDF model;sentiment Orientation Identification
随着网络技术的发展,特别是WEB2.0的逐渐应用,互联网越来越注重用户的交互性,即网站的内容通常由用户来参与发布,用户由传统单一地、被动地接收互联网信息向主动地、双向地创造互联网信息发展,互联网从而也显得更加人性化,也更具有开放性。由于大量用户的参与制造信息,产生了很多的有价值的对产品、事件、人的评论,比如博客、百度百科、维基百科等著名的网站,而这些评论信息中包含了众多的、强烈的主观色彩和情感信息,这种情感的论述反应了网民对某件事、某个人、某件产品的评论、观点和看法,对于这种大众舆论,在政府和企业作出某项决策时可能会起到重要的参考作用,因此如何从海量的评论信息中快速选取和整理用户感兴趣的内容,就成了计算机领域研究的重点。
文本情感倾向性研究正是在这个背景下产生的,所谓文本情感倾向就是对某段文本的褒贬倾向计算出一个度量值,这个度量值是通常规定在 之间的一个实数,如果最后计算出的度量值大于某个阈值的时候,判断文本倾向于褒;反之如果低于这个阈值的时候,判断文本倾向于贬。
通常根据处理文本的粒度的不同,可以将文本倾向性分析分为词语级、句子级、篇章级、
文档评论(0)