基于主题模型和集成学习的情感分析研究.pdfVIP

  • 46
  • 0
  • 约6.88万字
  • 约 51页
  • 2020-12-20 发布于江西
  • 举报

基于主题模型和集成学习的情感分析研究.pdf

摘要 摘要 随着我国网民数量的不断增加,互联网普及率的不断提高,各大互联网平台和移 动互联网终端的技术逐步成熟,导致互联网用户的大量增长。那么针对互联网文本数 据进行分析与挖掘,提取作者的情感倾向,从中发现用户隐藏的信息并加以引导与利 用,在市场情报、舆情预测等诸多领域都具有很强的现实意义。 本文在一些学者研究的基础上,提出了一种基于LDA2vec 主题模型的集成学习 分类器用于情感分析。本文主要进行了以下两个部分的工作: 第一,由于传统LDA 主题模型基于词袋模型,对文本中词序等重要的语义信息 有所忽略。所以本文尝试两种方法解决这个问题:第一种方法是使用LDA2vec 主题 模型进行信息提取;第二种方法是提出一种基于n-gram 算法的LDA 主题模型。本文 通过实验验证了两种模型在情感分析领域的有效性,可以提高情感分类的准确性。并 对模型结果进行对比,得出LDA2vec 主题模型在情感分析领域效果相对最好的结论。 第二,提出一种基于LDA2vec 主题模型的集成学习分类器。在使用LDA2vec 主 题模型进行情感分析的基础上,将多个基学习器的预测结果进行组合,完成分类任务。 首先通过LDA2vec 主题模型所计算提取语料库中的 “文档-主题”分布,然后根据 其概率划分训练数据子集进行基学习器的拟合,采用多数投票法汇总基学习器的预测 结果,得到最终分类器的分类结果,完成情感分类任务。通过模型对比试验,证明了 基于 LDA2vec 主题模型得集成学习分类器的效果,在情感分析领域,可以有效的分 辨出作者的情感,且结果具有一定可用性。 关键词:情感分析;主题模型;LDA2vec 模型;集成学习 I 目录 目录 1 绪论 1 1.1 研究背景 1 1.2 研究意义 2 1.3 国内外研究现状 2 1.3.1 基于集成学习的情感分析 3 1.3.2 文本主题模型 4 1.3.3 文献述评 5 1.4 本文的主要工作 5 1.5 本文的技术路线与结构安排 6 1.4.1 技术路线图 6 1.4.2 本文的主要工作内容 6 2 文本情感分析理论基础 8 2.1 引言 8 2.2 情感分析方法 8 2.2.1 基于情感词典的情感分析方法 8 2.2.2 基于机器学习的情感分析方法 8 2.2.3 基于深度学习的情感分析方法 9 2.3 情感分析的一般流程 9 2.3.1 数据预处理 10 2.3.2 文本表示方法 10 2.3.3 特征加权方法 11 2.3.4 机器学习分类算法 12 2.4 模型评价指标 13 2.5 本章小结 14 3 基于主题模型的情感分析 16 3.1 引言 16 3.2 主题模型概述 16 3.2.1 pLSA 主题模型 16 3.2.2 LDA 主题模型 18 3.3 基于n-gram 扩展的LDA 主题模型 20 3.3.1 n-gram 算法原理 20 IV 目录

文档评论(0)

1亿VIP精品文档

相关文档