- 46
- 0
- 约6.88万字
- 约 51页
- 2020-12-20 发布于江西
- 举报
摘要
摘要
随着我国网民数量的不断增加,互联网普及率的不断提高,各大互联网平台和移
动互联网终端的技术逐步成熟,导致互联网用户的大量增长。那么针对互联网文本数
据进行分析与挖掘,提取作者的情感倾向,从中发现用户隐藏的信息并加以引导与利
用,在市场情报、舆情预测等诸多领域都具有很强的现实意义。
本文在一些学者研究的基础上,提出了一种基于LDA2vec 主题模型的集成学习
分类器用于情感分析。本文主要进行了以下两个部分的工作:
第一,由于传统LDA 主题模型基于词袋模型,对文本中词序等重要的语义信息
有所忽略。所以本文尝试两种方法解决这个问题:第一种方法是使用LDA2vec 主题
模型进行信息提取;第二种方法是提出一种基于n-gram 算法的LDA 主题模型。本文
通过实验验证了两种模型在情感分析领域的有效性,可以提高情感分类的准确性。并
对模型结果进行对比,得出LDA2vec 主题模型在情感分析领域效果相对最好的结论。
第二,提出一种基于LDA2vec 主题模型的集成学习分类器。在使用LDA2vec 主
题模型进行情感分析的基础上,将多个基学习器的预测结果进行组合,完成分类任务。
首先通过LDA2vec 主题模型所计算提取语料库中的 “文档-主题”分布,然后根据
其概率划分训练数据子集进行基学习器的拟合,采用多数投票法汇总基学习器的预测
结果,得到最终分类器的分类结果,完成情感分类任务。通过模型对比试验,证明了
基于 LDA2vec 主题模型得集成学习分类器的效果,在情感分析领域,可以有效的分
辨出作者的情感,且结果具有一定可用性。
关键词:情感分析;主题模型;LDA2vec 模型;集成学习
I
目录
目录
1 绪论 1
1.1 研究背景 1
1.2 研究意义 2
1.3 国内外研究现状 2
1.3.1 基于集成学习的情感分析 3
1.3.2 文本主题模型 4
1.3.3 文献述评 5
1.4 本文的主要工作 5
1.5 本文的技术路线与结构安排 6
1.4.1 技术路线图 6
1.4.2 本文的主要工作内容 6
2 文本情感分析理论基础 8
2.1 引言 8
2.2 情感分析方法 8
2.2.1 基于情感词典的情感分析方法 8
2.2.2 基于机器学习的情感分析方法 8
2.2.3 基于深度学习的情感分析方法 9
2.3 情感分析的一般流程 9
2.3.1 数据预处理 10
2.3.2 文本表示方法 10
2.3.3 特征加权方法 11
2.3.4 机器学习分类算法 12
2.4 模型评价指标 13
2.5 本章小结 14
3 基于主题模型的情感分析 16
3.1 引言 16
3.2 主题模型概述 16
3.2.1 pLSA 主题模型 16
3.2.2 LDA 主题模型 18
3.3 基于n-gram 扩展的LDA 主题模型 20
3.3.1 n-gram 算法原理 20
IV
目录
您可能关注的文档
最近下载
- 行者讲课脉法下篇.doc VIP
- (人教版)数学一年级上册寒假应用题“天天练”作业设计,含30份题组,附参考答案.doc
- 多参数监护仪技术参数和要求.doc VIP
- HL德國創新機能家電烤箱HL-840用户手册.pdf
- (高清!)2025年3月29日河北省事业单位联考C类《职测》真题及答案.pdf VIP
- ZORRO遥控器中文说明书.pdf
- 多参数监护仪技术参数.doc VIP
- 05R417-1 室内管道支吊架建筑工程图集 高清.docx VIP
- 2025届安徽省江南十校高三下学期第一次联考(一模)数学试题含答案.pdf VIP
- 三年级上册数学思维训练题30题,拓展孩子思维能力201123.pdf VIP
原创力文档

文档评论(0)