机器学习中知识迁移方法分析-计算机软件与理论专业论文.docxVIP

下载本文档

4
0
约4.81万字
约 49页
2019-04-26 发布于上海
举报
版权申诉

机器学习中知识迁移方法分析-计算机软件与理论专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

山东师范大学硕士学位论文山东师范大学硕士学位论文 II II 目录摘要 i Abstract iii 第一章绪论 1 1.1 研究背景和意义 1 1.2 本文工作及贡献 2 1.2.1 本文组织结构 2 1.2.2 本文贡献 2 第二章迁移学习相关知识 4 2.1 传统机器学习技术 4 2.1.1 决策树分类技术 4 2.1.2 贝叶斯分类技术 4 2.1.3 人工神经网络 5 2.1.4 支持向量机 6 2.1.5 k-近邻分类 7 2.1.6 回归预测 7 2.3 迁移学习分类 9 2.4 迁移学习算法 10 2.4.1 归纳式迁移学习算法 10 2.4.2 转换式迁移学习算法 12 2.4.3 无监督迁移学习算法 13 2.5 迁移学习应用 14 第三章基于动态数据集重构的集成迁移学习 15 3.1 算法提出背景 15 3.2 相关理论知识 16 AdaBoost 算法描述 16 KL 散度 17 3.2.3 数据集分割重构 17 3.2.4 TrAdaboost 算法流程 18 3.3 动态数据集重构的提升集成迁移学习 19 DRTAT 算法流程 19 DRTAT 算法思想分析 20 第四章基于神经网络误差分析与数据重组的迁移学习 21 4.1 算法提出背景 21 4.2 问题描述 21 4.3 迁移贡献度的初始化 22 4.4 数据集重组与分类器集成[38] 23 4.5 NEDRT 算法思想分析 24 4.6 NEDRT 算法流程[42] 24 第五章基于向量平移和模糊聚类的迁移学习 26 5.1 算法提出背景 26 5.2 解决方法探讨 26 5.3 特征空间平移 27 5.4 模糊 C 均值聚类算法 28 山东师范大学硕士学位论文 5.5 算法流程 29 第六章实验分析 31 DRTAT 实验结果 31 6.1.1 实验数据 31 6.1.2 实验结果 32 HYPERLINK \l _TOC_250000 NEDRT 实验分析 32 6.2.1 数据集设置 32 6.2.2 实验结果 33 第七章总结与展望 36 7.1 本文研究内容总结 36 7.2 进一步的工作 36 参考文献 37 攻读学位期间发表的学术论文 40 致谢 41 II I 机器学习中知识迁移方法研究摘要传统的机器学习是基于统计学的机器学习，学习的任务就是在给定充分训练数据的基础上来学习一个分类模型，然后利用这个学习到的模型来对测试数据进行分类与预测。其中有一个基本的假设条件：训练数据与测试数据来自相同的特征空间而且服从相同的概率分布。但是在实际问题中，这种假设往往不成立，这样就导致学习到的模型无法很好的应用到测试数据上去，于是传统的机器学习技术就对这些问题的解决失去了效力。这往往需要我们去重新标注大量的训练数据以满足我们训练的需要，但标注新数据是非常昂贵的，需要大量的人力与物力。从另外一个角度上看，如果我们有了大量的、在不同分布下的已标记的训练数据，完全丢弃这些数据也是非常浪费的。如何合理的利用这些数据就是迁移学习主要解决的问题。目前根据源数据集和目标数据集中数据标记的情况不同，迁移学习可以划分为三类：归纳式迁移学习，直推式迁移学习和无监督迁移学习，其中前两种迁移学习是当今研究的热点。根据迁移对象的不同，现今解决迁移学习问题的方法可分为四种：实例迁移法，主要是通过挑选和提取对目标数据集训练有帮助的样例进行权重重组，将其作为辅助训练数据来帮助目标数据空间的学习；特征代表迁移法，主要是寻找一个“好”的特征代表来最小化各个特征空间或者分类器、回归模型之间的差异；参数迁移法，寻找源数据空间模型和目标数据空间模型之间的共同的参数或者前提来进行进一步处理达到知识迁移的目的；关联知识迁移法，通过建立源空间数据的关系模型与目标空间数据的关系模型的映射模型来实现知识的迁移,并假定两个数据空间是相关的而且各自服从独立同分布假设。本文对归纳式迁移学习进行了重点研究，在总结几种主流的迁移学习解决方法的基础上，提出了三种算法：基于数据集动态重组的集成迁移学习。算法首先将大量旧的已标记数据进行随机等量分割，把得到的旧数据的各个分块分别与少量的新已标记数据组合得到多个重构的训练数据集，然后分别训练分类器得到一个集成分类器，利用它对样例进行权值的更新，最后得到最终的集成分类器。基于神经网络误差分析和数据重组的集成迁移学习。首先利用已标记的目标数据训练一个神经网络分类器模型，然后把源数据集中的样例输入该模型中，利用输出的误差来为该样例的权重进行初始化，再利用分割重组的方式重组数据集并训练分类器，最后进行分类器的集