基于SVM网络文本情感分类系统研究与设计.docVIP

基于SVM网络文本情感分类系统研究与设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM网络文本情感分类系统研究与设计

基于SVM网络文本情感分类系统研究与设计   摘 要: 文本情感分类是指通过分析文本中的立场、观点、态度、情绪等主观信息,对文本的情感倾向做出类别判断。设计了一个基于SVM的网络文本分类系统;描述了该系统的结构和工作流程;对该系统实现的关键技术包括情感词典的构建、情感特征的选择、情感值的计算、网络文本情感分类器的构造等进行了深入的分析和研究。实验结果表明,该系统对网络文本情感倾向分类已达到较为理想的效果。   关键词: 情感分类; 网络文本; SVM; 情感分析   中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2015)12-34-04   Research and design of network text sentiment classification system based on SVM   Fan Kangxin   (School of Computer Science and Technology, Nantong University, Nantong, Jiangsu 226019, China)   Abstract: Text sentiment classification automatically classifies a text as expressing positive or negative sentiment through analyzing subjective information in the text such as standpoint, viewpoint, attitude, mood, and so on. A network text classification system based on SVM is designed in this paper. The system structure and work flow are described, and the key techniques are particularly discussed, that are how to construct the sentiment lexicon, how to select sentiment feature, how to calculate sentiment value, and how to construct the network text sentiment classifier, etc. The experiment results show that the system has the ideal effect on the classification of the sentiment orientation of Internet text.   Key words: sentiment classification; network text; SVM; sentiment analysis   0 引言   随着互联网进入了Web2.0时代,人们已从被动接受门户网站发布的信息,转变为以各种方式主动获取、发布、共享、传播各种信息。越来越多的普通用户习惯于在互联网上抒发个人情感、评论产品性能、讨论时事政策,由此产生了大量带有个人主观情感色彩的在线文本,如个人博客、产品评论、新闻评论等。在这些浩如烟海的文本中,大部分都带有作者对人、事、物的观点和态度,这些观点和态度对于网络电子商务、网络社区发掘、网络信息安全、网络信息检索等多方面都具有重要的意义和实用价值。利用计算机对这些信息进行分析和判别的方法被称为情感分析技术[1],该技术已成为当前互联网智能信息处理的研究热点。   文本情感分类是情感分析中的核心问题之一,主要用来判别自然语言文本中表达的观点、喜好,以及与感受和态度等相关的信息。本文设计并实现了基于SVM(Support Vector Machine,支持向量机)的网络文本情感分类系统,用于对网络文本的情感倾向作出判别。实验结果表明,该系统对网络文本具有较高的分类精度。   1 基于SVM的网络文本情感分类系统概述   基于SVM的网络文本情感分类主要研究如何将文本所表达的情感等主观内容进行分类,判断其是正面褒义的还是负面贬义的。本系统的设计是在构建情感词典的基础上进行情感特征选取与情感特征加权,然后使用SVM分类方法对网络文本进行情感识别与分类。该系统的结构和工作流程如图1所示。   首先,系统通过网络爬虫获取网络文本(如新闻评论、产品用户评价、BBS论坛帖子、个人博客等),对采集到的文本信息进行数据清洗、数据转化、分词处理、词性标注、去停用词等预处理;   其次,根据

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档