- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于word2vec扩充情感词典商品评论倾向分析
基于word2vec扩充情感词典商品评论倾向分析 摘要: 商品评论是用户对所购商品的信息反馈,在一定程度上代表了用户对商品的关注点和情感倾向,对企业具有重要的研究价值。该文提出基于word2vec的情感词典扩充方法,以此构建面向情感倾向分析的电商平台情感词典,旨在能较好地识别商品评论的情感倾向。试验中,该文将扩充的情感词典结合改进的情感词极性算法,用于天猫洗护类商品评论的情感倾向分析,实验表明了该方法的有效性
关键词:情感词典;word2vec;情感分析;电商平台
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2017)05-0143-03
Abstract: Product reviews can be treat as the feedback of user on the purchased of goods,Which,to a certain extent, represents the user’s focus on the commodity and emotional tendencies, has important research value to the enterprise. This paper proposes an extension method of emotional lexicon based on word2vec, in order to construct affective dictionary of sentiment platform for sentiment orientation analysis. In experiment, we use the method of expanding the emotional words of sentiment dictionary combine with improved sentiment word polarity algorithm for the sentiment analysis of Tmall care commodities reviews, Finally,The experiments prove the effectiveness of the method.
Key words: Sentiment Lexion ; word2vec; sentiment analysis ; E-commerce platform
随着计算机和互联网技术的发展,各种电商平台纷纷涌现。如何从繁杂的商品评论中识别用户的情感倾向,不仅是各大电商平台的关注热点,也是自然语言处理领域中亟待解决的问题,因此,文本倾向性分析成为计算机领域的研究热点之一。目前文本情感倾向性分析研究方法分为基于简单统计、基于相关性分析与基于机器学习三种。基于简单统计方面,主要通过求合法、向量空间法等对情感值进行简单的倾向性统计,邹嘉彦等[4] 通过对极性元素的分布、密度及语义强度等进行分析,实现相关新闻的褒贬分类。基于相关性方面,陈晓东[3]使用扩展的情感倾向点互信息算法(Semantic Orientation Pointwise Mutual Information, SO-PMI),从微博语料集中自动获取领域情感词,构建了微博情感词典,并将其使用于中文微博的情感倾向研究。姜亚华[2]优化了基于HowNet衡量语义相关度算法,并将其用于汽车领域的商品评论情感分析。在基于机器学习的研究方面,Wang[5] 选取形容词和副词这类修饰词作为特征,?⑵舴⑹焦嬖蛴氡匆端狗掷嗉际跸嗳诤喜⒂τ糜谖谋厩楦星阆虻姆掷唷P炝蘸甑?[6] 通过计算词汇与基准词间的相似度,进而利用支持向量机分类器对文本的褒贬性进行分析。但是目前针对商品评论的倾向性分析技术仍然存在以下问题:1)中文情感词典相对较少,各领域的情感词典并不兼容,例如主流的HowNet(知网)等在构建情感词典的过程中未考虑网络用语的更新;2)一般的情感词上下文极性算法的情感倾向识别准确率不高,而且可扩展性较差,情感词的极性仅仅考虑其原极性(情感词典所标注),在上下文存在关联关系,转折关系时,没有结合上下文语境考查其上下文极性。针对以上问题,本文以天猫商城洗护类商品评论的情感倾向分析为主题,首先通过word2vec算法在HowNet和NTU情感词典的基础上构建适用于电商平台的情感词典;其次给出了利用扩充的情感词典与改进的情感词极性算法计算情感词极性的方法,完成商品评论的情感倾向分析
1 基于word2vec的情感词典扩充
目前情感极性计算方法主要有基于语料库和基于情感词典2种方法。本文主要研究的是基于情感词典的方法。基于情感词典的情感极性计算
您可能关注的文档
最近下载
- 外墙保温板隐蔽工程验收记录表.docx VIP
- 江西省南昌市2024-2025年八下期末物理试卷.docx
- 高中化学:有机合成课件.pptx VIP
- 2024年深圳市宝安中学初中部小升初分班考试数学模拟试卷附答案解析.docx
- 富士LIFT(LM1S–4C)操作说明书.rar.doc VIP
- 某典型生产型企业2024年温室气体盘查清册(1张表搞定碳盘查).xlsx
- 化学-安徽省1号卷A10联盟2025届高三上学期8月开学摸底考试试题和答案.docx VIP
- 德龙M3000全车气路结构与工作原理-陕汽.pdf VIP
- 矿井11种图纸绘制要求.pdf VIP
- T_CCMA 0197-2024 高原隧道电动工程机械用动力电池安全要求及实验室试验方法.pdf
文档评论(0)