电子商务中基于非均衡数据分类和词性分析的意见挖掘研究.pdfVIP

电子商务中基于非均衡数据分类和词性分析的意见挖掘研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科技论文在线 电子商务中基于非均衡数据分类和词性分 析的意见挖掘研究# 1 2 1* 王刚 ,王珏 ,杨善林 5 (1. 合肥工业大学管理学院,过程优化与智能决策教育部重点实验室,合肥 230009; 2. 中国科学院数学与系统科学研究院,预测科学研究中心,北京 100190 ) 摘要:随着电子商务在现代社会的不断普及,网络商品评论作为消费者在网上购物过程中了 解商品质量的一个重要途径已受到越来越多的重视,并且已提出很多意见挖掘方法来帮助 10 消费者利用海量的网络商品评论数据。但目前研究对网络商品评论的非均衡分布特性还较 少关注,为此,本文提出基于非均衡数据分类和词性分析的意见挖掘方法。该方法综合基 于情感知识和机器学习两种意见挖掘方法,首先,分析电子商务评论的语言特征,对电子 商务评论中词语的词性进行分析,提出“留词性”和“去词性”两种分析方法;其次,根 据电子商务意见挖掘数据不均衡分布的特征,提出基于非均衡数据分类的意见挖掘方法。 15 最后,以三个不同电子商务网站的用户评论为语料库,对本文提出的方法进行检验,实验 结果验证了本文提出的基于非均衡数据分类和词性分析的意见挖掘方法的有效性,并且采 用去词性分析方法时,Random Subspace 在所有测试集上均取得了最好的分类结果。 关键词:意见挖掘;非均衡数据分类;词性分析;电子商务 中图分类号:TP391 20 Study of Opinion Mining in Electronic Commerce Based on Imbalanced Data Classification and Part of Speech Analysis 1 2 1 WANG Gang , WANG Jue , YANG Shanlin (1. The Ministry of Education Key Laboratory of Process Optimization and Intelligent Decision, 25 School of Management, HeFei University of Technology, HeFei 230009; 2. Center for Forecasting Science, Academy of Mathematics and Systems Science, China Academy of Sciences, BeiJing 100190) Abstract : With the popularization of electronic commerce, product reviews in the internet are paid more and more attentions when the customer is online shopping and get to know the quality of 30 products. Meanwhile, a lot of opinion mining techniques have been proposed to help customers to analyze these huge data. However, the imbalanced distribution of review datasets is paid less attention to. In this paper, a new method based on s

文档评论(0)

fdfdsos + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7100020006000001

1亿VIP精品文档

相关文档