- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
目 录
1 绪论 1
1.1研究背景与意义 1
1.2 国内外研究现状2
1.3 论文主要内容和组织结构4
1.3.1 论文主要内容4
1.3.2 论文组织结构5
1.3.3 论文创新点6
1.4 本章小结7
2 相关理论概述8
2.1机器学习概述8
2.1.1 机器学习分类8
2.1.2 机器学习回归9
2.2 贝叶斯分类器 10
2.2.1 贝叶斯相关理论 10
2.2.2 朴素贝叶斯分类器 11
2.2.3 半朴素贝叶斯分类器 13
2.2.4 加权朴素贝叶斯分类器 14
2.3 分类模型 15
2.3.1 逻辑回归 15
2.3.2 K近邻 17
2.3.3 支持向量机 17
2.4 分类性能评估 18
2.5 本章小结 19
3 本文获取及文本表示21
3.1 文本获取21
3.2 中文分词23
1
3.3 去停用词27
3.4 特征提取28
3.5 特征表示29
3.5.1 One-hot模型30
3.5.2 TF-IDF模型30
3.5.3 Word2vec模型31
3.6 本章小结33
4 改进朴素贝叶斯的新闻分类34
4.1 基于PCA 的加权朴素贝叶斯分类器34
4.1.1 主成分分析34
4.1.2 PCA_WNBC模型36
4.2 基于PCA 的加权朴素贝叶斯新闻分类37
4.2.1 新闻文本处理37
4.2.2 PCA_WNBC模型的新闻分类39
4.3 结果分析41
4.3.1 新闻分类结果41
4.3.2 模型评估42
4.4 本章小结45
5 总结与不足46
5.1 总结46
5.2 不足46
参考文献48
致 谢52
2
Contents
I ntroduction1
1.1 Research background and significance 1
1.2 Research status at home and abroad2
1.3 Main content and organizational structure of the paper4
1.3.1 Main content of the paper 4
1.3.2 Paper organization structure5
1.3.3 Thesis innovation 6
1.4 Summary of this chapter 7
2 Overview ofrelatedtheories 8
2.1 Overview of Machine Learning 8
2.1.1 Machine Learning Classification 8
2.1.2 Machine learning regression 9
您可能关注的文档
- 基于M-R分解模型的中国碳排放空间差异驱动效应研究.pdf
- 基于SERVQUAL模型的瑶里古镇旅游服务质量研究.pdf
- 基于Tapio模型的土地利用碳排放与经济发展的脱钩分析——以南昌市为例.pdf
- 基于TPB模型的老年游客乡村避暑行为意向研究——以江西靖安县三坪村为例.pdf
- 基于YOLOv3的自然场景字符检测方法研究.pdf
- 基于保荐人视角的科创板企业IPO财务尽职调查研究——以AK公司为例.pdf
- 基于不同核算方法差额的GDP准确性研究.pdf
- 基于传统文化蕴含下的民宿景观设计探究——以长沙市民宿为例.pdf
- 基于大气散射模型和分割算法的单幅图像去雾研究.pdf
- 基于定向增发与可交换债组合的大股东套利行为研究——以中泰化学为例.pdf
文档评论(0)