网站大量收购独家精品文档,联系QQ:2885784924

基于SVM的产品评论情感分析系统的设计与实现.docVIP

基于SVM的产品评论情感分析系统的设计与实现.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM的产品评论情感分析系统的设计与实现.doc

基于SVM的产品评论情感分析系统的设计与实现   摘 要:各大电商的产品留言体现了消费者对商品的主观情感,海量的评论信息要用人工来收集和处理是不可能完成的任务,因此需要利用专门的情感分析技术来帮助解决这些问题,文中将属性词词典,情感词词典以及程度词词典和否定词词典作为基础,通过SVM分类法对属性词和程度词的搭配进行识别,以此构造一个产品评论文本分析系统,测试表明系统对产品评论的情感分析具有较高的准确率。   关键词:产品评论;SVM;搭配识别;情感分析   中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2016)11-00-04   0 引 言   随着Web技术和电子商务的发展,越来越多的人在各大电商上对自己买过的产品发表评论,这些信息绝大部分代表着发布者的观点或主观情感。商家如果能够得到用户的这些反馈,将有助于商家的下一步生产和销售决策。而其他准备购买该商品的顾客也可以根据这些反馈来更好地帮助自己决定该商品是否值得购买。因此对这些情感信息进行有效的自动分析并构建相应系统成了当今的热门研究问题之一。   产品评论的挖掘分析主要是基于句子级别的情感分析,其主要任务有识别并获取产品的特征或属性,定位用户的主观性评论,抽取评论搭配,判别用户评论的褒贬[1]。本文构造的系统以属性词词典,情感词词典以及程度词词典和否定词词典为基础,通过SVM分类法对属性词和程度词的搭配进行识别,进而分析评论的褒贬。   1 相关研究   Probst等[2]利用监督学习技术抽取属性词―评论词关系对。Yohan等[3]基于LDA模型提出SLDA模型。实验表明,该类方法在抽取产品特征中有一定的效果。栗春亮等[4]利用百度百科和分词后相邻的词语同现比例来识别专业领域内的生词,在中文产品评论语料中设计词性组合模板来得到候选属性词集,然后利用一定的规则对其过滤。Qiu[5]等通过研究评价词和评价对象间的关系模式,提出用一种双向传播算法进行抽取。本文对产品属性词的抽取主要借鉴文献[4]中提到的方法,得到1 500个属性词,作为属性词词典。情感词典的构建方式主要有人工和基于词典两种。目前主要使用的词典有董振东和董强编撰的HOWNET情感词典和台湾大学编撰的NTU情感词典。Hassan等[6]使用马尔科夫随机游走模型计算词语的情感权值。柳位平等[7]在中文词语相似度计算方法的基础上提出了一种中文情感词语的情感权值计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。阳爱民等[8]选用若干个情感种子词,利用搜索引擎返回共现数,通过改进的PMI(Pointwise Mutual Information,PMI)算法计算情感词的情感权值。李寿山等[9]借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。本文主要根据文献[8]提出的方法,构建一个在产品评论分析中使用的情感词典,部分词如图1所示。程度词和否定词词典使用王文华等[10]提出的相应词典。   词集 极性 情感词   P_set 正向 著名,好,积极,和谐,青春,成熟,善良,文明,出色,舒服,纯真,得体,美丽,创造力,宽容,昌盛,感激,优秀,美好,灿烂,诚实,给力,帅呆,霸气,淳朴,漂亮,美妙,辉煌   N_set 负向 罪恶,诅咒,暴殄天物,郁闷,傻逼,变态,惨不忍睹,痛苦,垃圾,失败,委屈,毛病,扭曲,诡异,畸形,悲惨,崩溃,弱爆,狠毒,假冒,水货,粗暴   对属性词和情感词的搭配识别可以看成是一个分类问题,常用到的分类算法包括朴素贝叶斯分类器(Naive Bayesian Classifier)、基于支持向量机(Support Vector Machine,SVM)的分类器、k-最近邻法(k-Nearest Neighbor,kNN)、决策树(decision tree)分类法、最大熵模型(Maximum Entropy, ME)等,本文使用SVM作为搭配识别的分类器,搭配规则使用文献[10]中提到的8条规则。   2 情感分析系统的需求分析和设计目标   2.1 需求分析   产品评论情感分析系统用来对电子商务网站上的产品评论进行搜集分析。   (1)该系统首先对某个站点进行页面抓取、内容提取,得到用户对产品的大量评论信息;   (2)进行分词、关键信息抽取;   (3)对这些评论信息进行分析,挖掘出用户对产品各种属性的情感倾向以及对整个产品乃至商家的褒贬倾向;   (4)将结果进行展示,从而有效辅助希望购买产品的用户进行合理的消费判断,同时也能够帮助产品生产商做下一步生产和销售决策。   根据这些需求,可以对本系统做出如下需求分析:   (1)能够抓取产品评论页面并能对页面中的评论内

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档