基于文本挖掘的网购产品评论稳健情感分类研究.pdfVIP

  • 9
  • 0
  • 约5.3万字
  • 约 48页
  • 2023-02-19 发布于江苏
  • 举报

基于文本挖掘的网购产品评论稳健情感分类研究.pdf

摘要 随着互联网的快速发展,人们的日常购物场所逐渐由线下实体店转为线上网 店,其中,消费者购物体验后的评论作为一种重要的市场反馈,在网络销售和顾 客商品选购中有着重要应用,且近来随着越来越多的人适应这种网购模式,其规 模正日益增大。考虑到,对于网购用户而言,相关评论数据可能影响用户的最终 购买决定,而对于商家而言,评论数据可作为其获取经营决策信息,提炼出对消 费者和商家有价值的信息的重要基础,因此,如何对网购评论数据进行分析和挖 掘,并有效利用蕴含其中的有益信息正成为商品评论情感分析的重要研究方向。 但值得注意的是,对这种数据的挖掘以及分析方法和传统的方法有所差异,网络 购物用户评论是非结构化数据,传统的数据挖掘方法已不适用于网络购物用户评 论的分析。 有鉴于此,现有文献对此开展了大量前期研究。不过值得一提的是,现有方 法易受异常值影响,在实际中存在较大局限性。针对这一问题,本文在稳健聚类 分析方法的基础上,重点考察了如何将构建词典法、机器学习方法及深度学习的 相关方法应用于对评论数据进行情感倾向分类分析。本文主要以京东商城平台上 的华为P40Pro 和华为P40 手机为例,爬取了近20000 条评论数据,并且利用词 云图可视化技术和建立LDA 主题模型对评论数据进行语义挖掘分析,提取评论 数据的关键词与主题。 最终分析结果显示,本文运用稳健方法其结果更贴近客观实际。从产品款型 角度来看,华为P40pro 比华为P40 的好评率要更高,主要体现在拍照功能和运 行速度等等这几个方面。华为P40 比华为P40pro 更受欢迎的地方在于其小巧、 方便使用及性价比等方面。从消费者分类角度看,会员与非会员对手机所专注的 性能与功能大同小异,从所收集到的数据看,会员消费者更加关注于手机性能、 内存以及系统是否满意等,而非会员消费者主要关注手机外观是否漂亮、拍照是 否清晰及产品的性价比等。从手机特征角度来看,屏幕、性价比、物流、音质等 方面尚有待改进,尤其是屏幕和性价比,而手机外观设计及功能和客服服务,均 得到了用户的普遍认可。 本文通过对结果进一步的分析,比较基础版与升级版的评价,会员和非会员 的需求,分析消费者需求是否与商家提供的产品吻合,更加直观反映消费者需求 以及产品需要改造升级的地方,充分利用评论数据反映的信息,对商家以及消费 者提出合理建议。 关键词:文本挖掘;情感分析;稳健聚类;LDA 模型 V 目录 第1 章 绪论 1 1.1 研究背景及意义 1 1.2 国内外研究现状及述评2 1.2.1 文本挖掘相关研究2 1.2.2 情感分析相关研究4 1.2.3 文献述评5 1.3 研究思路与方法6 1.4 本文结构7 1.5 本文创新与不足之处8 1.5.1 本文创新8 1.5.2 不足之处9 第2 章 相关理论与方法 10 2.1 文本挖掘 10 2.1.1 文本挖掘相关概念 10 2.1.2 文本挖掘主要方法 10 2.2 情感分析 11 2.2.1 情感分析相关概念 11 2.2.2 情感分析主要方法 12 2.3 稳健聚类 14 2.3.1 聚类概念 14 2.3.2 聚类主要方法 14 第3 章 数据获取与处理 16 3.1 数据获取 16 3.1.1 网络爬虫方法介绍 16 3.1.2 数据采集 17 3.2 数据预处理 19 3.2.1 数据清洗20 3.2.2 中文分词20 3.2.3 去停用词22 3.3 数据可视化22 3.3.1 词频统计22 3.3.2 词云图24 第4 章 评论数据聚类和主题词提取25 4.1 稳健聚类25 4.2 主题模型26 4.3 基于LDA 模型的主题词提取27 I 第5 章 基于评论的情感倾向分析31 5.1 基于情感词典的情感分类31

文档评论(0)

1亿VIP精品文档

相关文档